大模型
-
混合专家模型(MoE)2022-2023顶会顶刊论文合集,包含算法、系统、应用3大类
混合专家模型(MoE)是一种深度学习技术,它通过将多个模型(这些模型被称为”专家”)直接结合在一起,以加快模型训练的速度,获得更好的预测性能。这种模型设计策…
-
Text-to-SQL小白入门(十一)DAIL-SQL教你刷Spider榜单第一
论文概述 学习这篇Text2SQL+LLM的benchmark论文前,可以先学习一下基础的Text2SQL知识。 可以参考GitHub项目:GitHub – eosph…
-
热门AI通用大模型对比盘点(附论文)
今天我来和大家聊聊通用大模型,垂直领域大模型等整理完了再和大家分享。大家可以先关注一下我,有更新可以立马看见。 本文文末有整理好的通用大模型论文,都是各个大模型的原始论文,强烈建议…
-
NeurIPS 2023|AI Agents先行者CAMEL:第一个基于大模型的多智能体框架
AI Agents是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的LLM Agents参与到实际的任务中,Agents之间会进行竞争和协作等多种形式的动态交互,进而产…
-
2024年1月10日最热AI论文Top5:DebugBench、AI智能体对齐、开放域问答系统、谈判游戏、联邦学习
本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台(saibomaliang.com)上的智能体 …
-
ChatGPT 各类 Prompt 整理
前言 如果你对这篇文章感兴趣,可以点击「【访客必读 – 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。 文章写作 修正 【论文修正】Proofre…
-
用通俗易懂的方式讲解:为什么大模型 Advanced RAG 方法对于AI的未来至关重要?
检索增强生成(Retrieval-augmented generation,RAG)代表了生成式人工智能领域的重大进展,将高效的数据检索与大型语言模型的强大功能相结合。 在其核心,…
-
智谱AI发布国产最强大模型GLM4,理解评测与数学能力仅次于Gemini Ultra和GPT-4,编程能力超过Gemini-pro,还有对标GPTs商店的GLMs
本文来自DataLearnerAI官方网站:智谱AI发布国产最强大模型GLM4,理解评测与数学能力仅次于Gemini Ultra和GPT-4,编程能力超过Gemini-pro,还有…
-
今日最佳AI论文5篇:高效微调、图生3D、AI Agent、大模型ChatGPT、图学习
本文整理了2023年1月9日发表在ArXiv上的AI论文中最热门的TOP 5。 论文热度排序、论文标签、中文标题、推荐理由和论文摘要由AI论文推荐智能体 赛博马良-AI论文解读达人…
-
linux Ubuntu Python 3.10 环境报错与解决方案集合
环境配置参考文章:使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调 1.报错.nvidia/cublas/lib/libcublas.so.11: undefine…
-
【2023 CSIG垂直领域大模型】大模型时代,如何完成IDP智能文档处理领域的OCR大一统?
目录 一、像素级OCR统一模型:UPOCR 1.1、为什么提出UPOCR? 1.2、UPOCR是什么? 1.2.1、Unified Paradigm 统一范式 1.2.2、Unif…
-
【自然语言处理】【分布式训练及推理】推理工具DeepSpeed-Inference
相关博客 【深度学习】【分布式训练】Collective通信操作及Pytorch示例 【自然语言处理】【分布式训练及推理】推理工具DeepSpeed-Inference 【自然语言…
-
【AI视野·今日NLP 自然语言处理论文速览 第六十九期】Wed, 3 Jan 2024
AI视野·今日CS.NLP 自然语言处理论文速览 Wed, 3 Jan 2024 Totally 24 papers 👉上期速览✈更多精彩请移步主页 Daily C…
-
AI大模型:无需训练让LLM支持超长输入
显式搜索: 知识库外挂 paper: Unleashing Infinite-Length Input Capacity for Large-scale Language Mode…
-
用通俗易懂的方式讲解:使用 MongoDB 和 Langchain 构建生成型AI聊天机器人
想象一下:你收到了你梦寐以求的礼物:一台非凡的时光机,可以将你带到任何地方、任何时候。 你只有10分钟让它运行,否则它将消失。你拥有一份2000页的PDF,详细介绍了关于这台时光机…
