Books Related to Knowledge Graphs & Deep Learning for Graphs


Accepted Top-tier Papers


2026


2025

IEEE INFOCOM | ICC | IJCAI | The Web Conference | SIGIR | ACL | ICDCS | ICDE | ACM SIGMOD | VLDB | ACM Multimedia | ICSE | CHI | ICDCS | EMNLP | NAACL | ISWC | LREC-COLING | ECML-PKDD | ICME | ICMR | IJCNN | PAKDD | ECIR | UIC | ICDM | CIKM | ECAI | ICWSM | ICWS | ICSOC | DASFAA | ETAPS | SANER | ESEM | ISSRE | ICSME | ICPC | RE | CAiSE | IEEE BigData | IEEE BigDataService | ADMA | APWeb-WAIM | ICONIP | KSEM | ESWC | PRICAI | SEKE | SETTA | EASE | Internetware | QRS | APSEC | MSR | REFSQ | ICWE | WISE | AACL | CCL | CCKS | CCIR | ICWSM | ACM Multimedia Asia | ChinaMM | ChinaSoft | ChinaService | ChineseCSCW | AKBC | IJCKG |

2024

IEEE INFOCOM | ICC | IJCAI | VLDB | ACM SIGMOD | ICDE | ACL | SIGIR | ACM Multimedia | ICSE | CHI | ICDCS | KR | EMNLP | NAACL | ISWC | LREC-COLING [LREC-COLING 2024 Announcement] | ECML-PKDD | ICME | ICMR | IJCNN | PAKDD | ECIR | UIC | ICDM | CIKM | ECAI | ICWSM | ICWS | ICSOC | DASFAA | ETAPS | SANER | ESEM | ISSRE | ICSME | ICPC | RE | CAiSE | BIBM (Download) | PRCV | IEEE BigData | IEEE BigDataService | ADMA | APWeb-WAIM | ICONIP | KSEM | ESWC | PRICAI | SEKE | SETTA | EASE | Internetware | QRS | APSEC | MSR | REFSQ | ICWE | WISE | CASA | AACL | CCL | CCKS | CCIR | WASA | ICWSM | ACM Multimedia Asia | ChinaMM | ChinaSoft | ChinaService | ICSS | ChineseCSCW | AKBC | ICKG | IJCKG | 今日最热AI论文Top5:AI智能体对齐、开放域问答系统、DebugBench、谈判游戏、联邦学习 | 第五届空间数据智能学术会议SpatialDI 2024 |
ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高 | 快讯|北邮GAMMA LAB的五篇工作被www 2024 接收 | 人大高瓴人工智能学院师生论文被国际学术会议WWW 2024录用 | 天津大学自然语言处理实验室9篇论文被LREC-COLING 2024接受! | 复旦大学数据智能与社会计算实验室五篇论文被WWW、AAAI和COLING录用 | 哈工大SCIR 12篇长文被COLING 2024录用 |

2023

IEEE INFOCOM | ACL | ICDCS | ICDE | ACM SIGMOD | VLDB | SIGIR | IJCAI | ACMM | ASE | FSE ESEC | ICSE | AAMAS | ICAPS | CHI | ICDM | CIKM | ICWSM | DASFAA | ETAPS | SANER | ESEM | ISSRE | ICSME | ICPC | RE | CAiSE | ICWS | ICSOC | IWQoS | EMNLP | ISWC | ECML-PKDD | ICME | ICMR | IJCNN | PAKDD | ECIR | UIC | Recsys | BIBM (Download) | ICASSP | IEEE BigData (Download) | NLPCC | ADMA | APWeb-WAIM | ICONIP | KSEM | ESWC | PRICAI | DEXA | SEKE | SETTA | EASE | Internetware | QRS | APSEC | MSR | REFSQ | ICWE | CASA | RANLP | AACL | CCL | CCKS | CCIR | ICWSM | ICWL | ICKG | ACM Multimedia Asia | ACM Multimedia Asia | ChinaMM | ChinaSoft | ChinaService | ChineseCSCW | AKBC | IJCKG | ICSOC | PRAI | WISE | WISA | ACM SIGSPATIAL | SIGIR-AP | CCF BigData | NDBC | ACAIT | ICCSI | CCBR | PRCV | CBC | 2023CCF数字农业分会年会暨第一届CCF数字农业大会 |
Soundness?Excitement?官方解读ACL 2023论文评分机制 | 信工所14篇论文被顶级国际会议ACL 2023录用,一文速览! | ACL'23颁奖井喷!史无前例75篇论文上榜,华人面孔占据半壁江山 | 自然语言处理顶会ACL 2023收录西湖大学工学院最新成果 | 论文导读 | ACL-2023 文档级事件抽取 (1) | KDD 2023奖项出炉:港中文、港科大等获最佳论文奖,GNN大牛Leskovec获创新奖 | 论文导读 | ACL-2023 事件检测 | 夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文 | EMNLP 2023 Best Paper公布啦! | 多篇论文入选ICASSP 2023!火山语音有效解决多类实践问题 | 快讯|北邮GAMMA LAB的三篇工作被CIKM 2023 接收 | LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT |
CCCF精选|机器学习:从先验假设到自动化——迈向通用人工智能的必然步骤 | 从EMNLP 2022速览信息检索领域最新研究进展 | Gartner发布:2023年十大重要技术趋势 | 清华青年最关注的改变未来十大变革科技 | 字节跳动李航:人工智能需要新的范式和理论 | 神经符号 AI,或为下一代 AIoT 的新解法 | Hinton 最新研究:神经网络的未来是前向-前向算法 | 2023年及未来五大技术趋势预测 | 年度汇总!一文了解2021 IEEE Transaction Winner奖19篇论文 | 中科院发布《2022研究前沿》报告 | Nature发布2023年值得关注的9个科学大事件,新型疫苗位列榜首 | 回顾2022,那些令人印象深刻的AI突破 | 吴恩达来信:2023人工智能热点展望 | 微软研究院刘铁岩畅谈AI for Science :追求人类智能最光辉的一面 | 《麻省理工科技评论》2023年“全球十大突破性技术”正式发布 | 上篇丨DeepTech发布《2023年生物医药技术趋势展望》研究报告——基础技术的突破不断引领生物医药创新前沿 | 9位院士12位专家联合撰文:智能计算的新进展、挑战与未来 | Science合作期刊 | 《达摩院2023十大科技趋势》发布,生成式AI、多模态预训练大模型入选 [Report] | AI终极问题最后一公里——机器意识,UCL汪军教授谈克服深度学习根本性问题 | 张东晓院士:科学机器学习中的知识嵌入与知识发现 | ICLR 2023论文接收列表公布,top5%都涉及ICL、扩散模型等方向,引热议 | 热情拥抱人工智能时代 | 他山之石丨AI认知架构四十年:发展与挑战 | 以太网之父Bob Metcalfe荣获图灵奖,其同名定律成为互联网经济基石 | 硅谷 NEC 关系图:将中国企业拽进 AI 时代的人 |

Code Understanding:
代码表征预训练语言模型学习指南:原理、分析和代码 |

Graph Representation:
一文浅谈Graph Transformer领域近期研究进展 |

Knowledge Graphs:
知识就是AI的力量:从知识工程到知识图谱全面回顾 | 知识就是AI的力量:从知识工程到知识图谱全面回顾 (新) | 技术动态 | 利用知识图谱克服人工智能幻觉 |

懂理性的AI Models:
2023将至,Bengio等大佬年度展望!懂理性的AI模型要来了? |

“神经” + “符号” Models:
重新审视AI,神经网络中概念符号涌现的发现与证明 |

通用AI Models:
一家之言丨像天使也似魔鬼:关于通用人工智能时代科学研究的71个问题 | 他山之石丨10张图总结2023年人工智能状况 |

Big Models:
推特炸锅啦!「是否暂停巨型AI实验?」LeCun、吴恩达带头反对 | 为何不能暂停 AI 研发?杨立昆、吴恩达对话实录 |

ChatGPT:
ChatGPT保姆级注册教程 | 一文教你快速注册OpenAi (ChatGPT),国内也可以! | 从爆火的chatGPT讲起: 自然语言生成式AI的前世今生 | ChatGPT Prompt工程:设计、实践与思考 | Sam Altman:ChatGPT 不会取代谷歌搜索,但未来的 AI 可能会 | 吴恩达: ChatGPT大型语言模型获得成功的背后原因探析 | 多模态版ChatGPT,拿下视觉语言新SOTA, 代码已开源 | ChatGPT下的知识图谱审视:一次关于必然影响、未来方向的讨论实录与总结 | 谷歌版ChatGPT首秀,第一个Demo就大翻车,市值暴跌7000亿 | 开局打爆谷歌,微软ChatGPT版必应亲测:强到发指! | ChatGPT爆火,LeCun心态崩了!称大语言模型是邪路,Meta模型3天惨遭下线 | 挑战ChatGPT,谷歌正式发布Bard,CEO亲自下场邀请测试 | 多模态版ChatGPT,拿下视觉语言新SOTA, 代码已开源 | ChatGPT背后的经济账 | 危!ChatGPT一出,这10大职业可能先丢饭碗 | 谷歌版ChatGPT翻车了!市值暴跌7000亿 | 首篇ChatGPT辅助写作的论文,已在arXiv发表! | 《降临》作者特德·姜:ChatGPT是网上所有文本的模糊图像 | 专访之江实验室副主任鲍虎军:ChatGPT凭何搅动人工智能的“一池春水”? | ChatGPT背后模型被证实具有人类心智!斯坦福新研究炸了,知名学者:“这一天终于来了” | 全面学习 ChatGPT,机器之心准备了 89 篇文章合集 | ChatGPT国内赛道开卷,互联网大佬带资3.5亿宣布入场 | 无法阻止ChatGPT杀入学术圈,Nature一周连发两文引发大辩论 | 访谈实录|停止对ChatGPT的空洞唱和,不如反思人类社会的诸多设计 | ChatGPT通过美国执业医师资格考试?医疗人工智能会取代还是帮助医生 | 让ChatGPT长“手”!Meta爆火新论文,让语言模型学会自主使用工具 | ChatGPT加持下的微软New Bing 错误频出,别只骂谷歌的Bard了 | ChatGPT风口上的微软,解散了工业元宇宙应用团队 | 抢中国版ChatGPT首发的公司们 | 【chatGPT】和chatGPT结对编程的6小时 | ChatGPT 数据集之谜 | ChatGPT版Bing被调戏到生气发飙,ChatGPT被证实具有人类心智 | S级秘术!指导ChatGPT训练一个神经网络的超详细「指令」来啦! | AI大佬不满ChatGPT:亟待完善ChatGPT的道德护栏 | 用 ChatGPT 将 Excel 工作效率提高 10 倍!离做PPT还远吗 | 日烧70万美元的ChatGPT如何融入搜索引擎 | 超越GPT 3.5的小模型来了! | ChatGPT逼急谷歌,劈柴发全员信:别慌,迟到也能赢! | 张家俊:关于ChatGPT八个技术问题的猜想 | OpenAI透露ChatGPT未来发展计划:要与人类价值保持一致 | 跟李沐学ChatGPT背后技术:67分钟读透InstructGPT论文 | 港大全面封杀ChatGPT;重新思考ChatGPT抄袭检测;挣钱多的人智商更高?|热点回顾 | 为什么所有公开的对 GPT-3 的复现都失败了?复现和使用GPT-3/ChatGPT,你所应该知道的 | GPT版超级马里奥来了!用文字生成游戏关卡自己玩是一种什么样的体验? | 为什么所有公开的对 GPT-3 的复现都失败了?复现和使用GPT-3/ChatGPT,你所应该知道的 | 跟AI唠嗑,年入33万美金!ChatGPT时代的必备新技能 | GPT系列的数据集之谜 | ChatGPT劲敌团队发布,可轻松引导ChatGPT不要输出有害言论! | 追赶ChatGPT的难点与平替 | 硅谷大佬:我为什么要逃离谷歌? | 张家俊:关于ChatGPT八个技术问题的猜想 | 开源版GPT-3来了?Meta发布LLaMa,多数任务效果超越GPT-3,已开源 | 用ChatGPT操控机器人,微软开启居家机器人新纪元! | 追赶ChatGPT的难点与平替 | 没有这些,别妄谈做ChatGPT了 | 强强联合!谷歌大模型团队并入DeepMind!誓要赶上ChatGPT进度 | 腾讯类ChatGPT保密项目爆出,张正友带队研发「混元助手」 | 已上线公测!打开就能用的“中国版ChatGPT”,速来过招 | 打造ChatGPT的团队:平均年龄32岁!华人成员:清北+名校深造 | GPT全家桶再添一员!看论文神器,ResearchGPT,可立即试用 | 从BERT到ChatGPT,9大顶尖机构发布:那些年一起追过的「预训练基础模型」 | 专委会动态|从心智计算研究的视角审视ChatGPT与人工智能内容生成专题研讨观点汇聚 | 微软发布多模态版ChatGPT!取名“宇宙一代” | 哈工大张民:ChatGPT之后,NLP还有12个待解决命题 | LeCun:ChatGPT无法实现通用人工智能,但ALM技术路线可以! | 「国际科技信息中心SCITIC论坛」从ChatGPT、流浪地球、虚拟数字人、AIGC探索数字化创意,展望人类与AI的共创 | “ChatGPT与未来教育”沙龙成功举办 | UCL汪军呼吁创新:后ChatGPT通用人工智能理论及其应用 | 科技部部长谈ChatGPT时,举了这样两个例子 | 邱锡鹏教授:大型语言模型的能力分析与应用 | 大神李沐加入AI大模型创业,导师Alex Smola是创始人 | 一人改代码搞崩推特,马斯克气疯:全部重写! | 重磅!谷歌发布5620亿参数多模态模型PaLM-E,机器人操控无所不能 | ChatGPT之后我们要做什么?丨文本生成中的知识和控制 | 王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天 | GPT-4将于下周发布,微软德国CTO:将提供完全不同的可能性 | 活动实录|胡芳槐博士、王昊奋博士“ChatGPT探索语言未来”线上圆桌会精彩发言 | 乔姆斯基:ChatGPT的虚假承诺 | 巅峰对话:ChatGPT爆火之后,AIGC元年真的到来了?| 甲子光年 | 王川:关于 chatGPT 的随想 (一) | 复旦MOSS团队深度访谈:研究成果将会开源 | ChatGPT让亚马逊梦碎!微软CEO狂贬语音助手 | 语言学巨头乔姆斯基评ChatGPT:缺乏任何智能的关键能力,追捧就是浪费资源 | ChatGPT三问:是什么、从哪来、去往哪? | ChatGLM:千亿基座的对话模型启动内测,单卡版模型已全面开源 | 惊呼!在Mac上可以跑LLaMA啦!附上详细教程 | 【升级版ChatGPT-Plus】OpenAI震撼发布GPT4,并公布论文、System Card,开放API | GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了? | 【他山之石】GPT-4发布!史上最强大模型来了 | 【上游新闻】漫谈ChatGPT|重庆大学大数据与软件学院院长:看好ChatGPT未来在软件开发中“代码智能”研究领域的潜力 | GPT-4简单初体验,和ChatGPT试用效果对比 | ChatGPT对律师业的冲击 | 斯坦福发布大模型Alpaca:A100上训3小时,性能比较GPT-3.5,被挤爆! | 谷歌宣布开放PaLM API,可在浏览器内操作,终于可以尝试大模型啦 | 体验过百度文心一言,也许真会超出你的预期(5个邀请码) | 复旦邱锡鹏:深度剖析 ChatGPT 类大语言模型的关键技术 | 微软深夜放炸弹!GPT-4 Office全家桶发布,10亿打工人被革命! | 张俊林:GPT-4 模型会开创哪些新的研究方向? | GPT-4不披露技术细节,马斯克批判其背离初心,OpenAI不“open“了 | OpenChatKit:开源ChatGPT替代方案 | 张俊林:从GPT-4看LLM的技术发展趋势 | 清华系ChatGPT发布!唐杰团队打造,专对中文优化,还能把握最新新闻动态 | 如何利用ChatGPT进行Rebuttal,搞科研! | 任正非最新谈中美、科技、ChatGPT | 【他山之石】田渊栋:关于GPT-4的一些感想 | 突发!李开复宣布筹办新公司:不仅是中国版ChatGPT,全球招英才 | 他山之石丨GPT-4模型会开创哪些新的研究方向? | 微软提出MathPrompter,GPT3的数学推理水平直接干到人类水平 | 第一款基于GPT4的手机APP来啦,一键解读图片,颠覆生活 | ChatGPT的10个平替项目,玩转AIGC | ChatGPT崩了!全球宕机超12小时,打工人叫苦连天 | 深挖GPT-4背后的技术方向,华人开发者成绩斐然 | OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大 | 文心一言的魔性作图,我头都笑掉了... | 基于ChatGPT的生物医药知识抽取测评 | 最卷一夜!Google版 ChatGPT 开放、英伟达又投下核弹显卡……一觉醒来AI又变天了 | 危!GPT将影响80%工作岗位,挣得越多越危险?OpenAI发布重磅研究 | 弥补斯坦福70亿参数「羊驼」短板,精通中文的大模型来了,已开源 | 谷歌正式开放「Bard」试用,很遗憾。。 | 产业级文心大模型ERNIE-UIE在金融监管场景中的应用 | GPT-4太强,OpenAI也不懂!智能到底是怎么突然「涌现」的? | ChatGPT这么牛,我们应该如何兼顾发展和治理? | 他山之石丨从谷歌与OpenAI的战争来看AI人才的重要性 | GPT-4的前世、今生和未来! | 英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM | 当GPT-4学会看图文,一场生产力革命已势不可挡 | ChatGPT全宇宙大爆炸!开启联网解除封印,无敌插件彻底颠覆体验 | ChatGPT鲁棒性分析:对抗鲁棒与分布外泛化视角 | 陆首群:ChatGPT不开源是说不过去的 | Github官宣新一代Copilot X,集成GPT-4的编码神器!动动嘴就能开发 | ChatGPT重磅升级,可以联网、添加插件!最后的封印解除了! | GPT-4开启AGI之门?微软最新刷屏154页《通用人工智能的火花:GPT-4的早期实验》报告,探究去向AGI之路 (附中文版) | 【ChatGPT系列报告】ChatGPT/AIGC到底能做什么?生成式 AI 将重塑几乎所有行业 | ChatGPT 已成为下一代的新操作系统! | 首个接入 GPT-4,曾经比 GitHub Copilot 还好用的代码编辑器,开源了! | 他山之石丨 ChatGPT作为知识库问答系统的问答能力评测 | GPT-4 已经可以独立创业了,感觉自己在追剧,一个人就是一家公司 | 加了插件的 ChatGPT 目前确实是中心,希望未来的机联网不是 | AIGC周报|周鸿祎:GPT-6到GPT-8或将产生意识,成为新物种;OpenAI:我们将重建信任;“让他看起来像梵高” | 给表情包都能猜电影,ChatGPT的涌现能力是从哪里来的? | 微软豪华力作,称GPT-4已具备人类心智,LeCun质疑 | 可以微调类ChatGPT模型啦!开源Alpaca-LoRA+RTX 4090就能搞定 | 汪军教授组织了7位AI学者,论道ChatGPT后的通用人工智能理论和应用 | 工业AI也将迎来「ChatGPT时刻」 | GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑 | 当GPT-4反思自己错了:性能提升近30%,编程能力提升21% | ChatGPT 加持,决策大模型距离 AGI 更进一步 | 百度智能云发布“文心千帆”:实时演示,全能助手,价格比 ChatGPT 低 | 众说纷纭:大模型要颠覆软件开发了吗? | Stealing Large Language Models: 关于对ChatGPT进行模型窃取的一些工作 | LeCun最新演讲,痛批GPT类模型没前途,称“世界模型”是正途! | MIT新方法让GPT-4学会反思,写代码能力提升21%! | 立即停止训练比 GPT-4 更强的模型,至少六个月!马斯克、图灵奖得主等数千 AI 专家紧急呼吁 | 千名大佬发联名信,叫停GPT-5超强大模型! | 北大“韦神”出了道数学题,有老师用ChatGPT做答,结果出乎意料 | GPT-4救了我狗的命 | 哈工大计算学部长聘教授车万翔:ChatGPT浅析 | 暂停GPT-5研发呼吁引激战!吴恩达、LeCun带头反对,Bengio站队支持 | 学术专用版ChatGPT火了,一键完成论文润色、代码解释、报告生成 | OpenAI全新插件系统:代码解释器!又一款宝藏插件诞生!训模型、迷宫游戏、二维码生成 | ChatGPT消灭全球3亿打工人!高盛重磅预测:25%岗位将被AI取代 | 【官方教程】ChatGLM-6B微调,最低只需7GB显存 | 论文导读 | 大语言模型上的精调策略 | “ChatGPT们”的淘金时代 | GPT 模型成功的背后用到了哪些以数据为中心的人工智能(Data-centric AI)技术? | 浅评ChatGPT在软件开发上的辅助能力(附GPT-4对比) | 媒体发声丨肖仰华教授解读暂停巨型AI实验联名公开信 | 如果ChatGPT有1%的风险伤害你,你还会用它吗?超级智能值得恐惧吗 | 推特炸锅啦!「是否暂停巨型AI实验?」LeCun、吴恩达带头反对 | ChatGPT与教育的未来 | 精彩活动丨“通用人工智能时代的科学研究——机遇与挑战”研讨会顺利召开 | ChatGPTScan:使用ChatGPTScan批量进行代码审计 | 看不见的挑战:探寻GPT-4的能力极限,突破还是止步于此? | 限时免费使用ChatGPT,让科研更高效! | 技术动态 | 基于GPT-4的知识图谱构建能力评测 | ChatGPT在意大利被禁,OpenAI被限20天内补救 | 中国人民大学卢志武:ChatGPT对多模态通用生成模型的重要启发 | 3090单卡5小时,每个人都能训练专属ChatGPT,港科大开源LMFlow | 智能化时代的软件工程:拥抱大模型的正确姿势 | ChatGPT哲学之谜 | SETalk精彩回顾:ChatGPT对软件工程的新机遇上篇(文末有完整视频回看) | 130亿参数开源模型「小羊驼-Vicuna」来了!复刻ChatGPT九成功力,GPT-4亲自监考 | 重磅!微软推出HuggingGPT:所有HuggingFace的模型都可以被ChatGPT随意调用! | ChatGPT 类大语言模型为什么会带来“神奇”的涌现能力? | 阿里版ChatGPT就快来了 | ChatGPT赋能工作岗位预测,让你从容面对职业转型与升级! | LeCun力荐!哈佛博士分享如何用GPT-4搞科研 | 非常全面:72页ChatGPT研究框架(2023)ppt(附下载) | 重新审视AI,神经网络中概念符号涌现的发现与证明 | 谷歌TPU超算,大模型性能超英伟达,已部署数十台:图灵奖得主新作 | Open AI创始人Sam Altman:关于ChatGPT系统设计背后的18个关键思考 | 医疗ChatGPT、金融GPT都来啦!“潘多拉的魔盒”已经打开? | ChatGPT的副作用逐渐显现:人逐渐“废柴化” | 首个超大规模GAN模型!生成速度比Diffusion快20+倍,0.13秒出图 | 从集异壁理解ChatGPT的成功与局限 | ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型 | CV不存在了?Meta发布CV届的GPT模型「SAM」,可以分割一切 | CV开启大模型时代!谷歌发布220亿参数史上最大ViT,视觉感知力直逼人类 | 上海人工智能实验室发布「风乌」大模型,全球气象有效预报时间首破10天 | 沉默已久的Bengio发文:赞成暂停超强AI研发,LeCun亲自出镜反对 | ChatGPT 能自己跑代码了! | GPT-4压根不会编程?有人让它露馅了 | GPT-4的"第一次接触":《AGI的火花》作者的披露演讲万字全文 | 阿里「通义千问」大战百度「文心一言」15个回合后,GPT4沉默了 | 吴恩达杨立昆亲自下场开直播:GPT-5不能停! | 基于重排序的新量化方法RPTQ:实现大型语言模型的 3 比特量化 | 吴军博士:ChatGPT不算新技术革命,带不来什么新机会 | 阿里版 ChatGPT 官宣!我们用 16 个提问,火速进行了测评…… | 训练ChatGPT的必备资源:语料、模型和代码库完全指南 | 微软首次使用GPT-4进行指令微调,新任务零样本性能再提升 | HuggingGPT 刚刚开放了demo!在线演示效果惊艳 | 推特爆火!揭晓大模型的未来何去何从 | Meta「分割一切」超进化版来了!检测、分割、生成一切,狂揽2k星 | 阿里版 Copilot 惊艳亮相,AI 领域正式进入下半场火拼 | 阿里版 Copilot 惊艳亮相,AI 领域正式进入下半场火拼为何不能暂停 AI 研发?杨立昆、吴恩达对话实录| AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星 | 日本首相会见奥特曼,考虑引入ChatGPT技术 | 大模型已涌现社会行为,斯坦福爆火论文打造《西部世界》雏形 | ChatGPT时代,图灵测试已死 | 他山之石丨意识机器:ChatGPT 能否拥有自我意识? | 重磅!微软开源Deep Speed Chat,人人拥有ChatGPT! | GitHub 2.7万星!AutoGPT太火了,无需人类插手自主完成任务 | 无需强化学习的与人类偏好对齐的语言模型:Wombat袋熊 | GPT-5年底上线?初创公司Runway CEO再爆料:OpenAI员工相信GPT-5有望成AGI | 世界首款真开源类ChatGPT大模型Dolly 2.0,可随意修改商用 | 如何利用ChatGPT帮助开展日常科研工作? | 谷歌发布Self-Debug方法,让大模型学会自己修bug,一次性生成正确代码 | 顶不住了!OpenAI 宣布启动漏洞赏金计划,众包给ChatGPT找bug | 孙凝晖院士:科学发展进入了停滞期,要培养更多敢挑战权威的人才 | 亚马逊高调入局ChatGPT大战,发布Titan大模型、AI编程助手全免费,CEO:改变所有体验 | Wombat:93%ChatGPT性能!无需RLHF就能对齐人类的语言模型 | 又一恐怖技能!卡耐基梅隆大学发布超强智能体,炸翻科研圈 | 微软震撼开源DeepSpeed Chat,一键实现ChatGPT的端到端RLHF训练 | GPT-5根本不存在!ChatGPT之父Sam Altman首次公开表态,最新视频流出 | ChatGPT或要推出APP,OpenAI官宣为ChatGPT招募移动端开发工程师 | SEEM:微软基于 CV 大模型新作,分割“瞬息全宇宙” | 制造业「ChatGPT」来了,我们和「奇智孔明」聊了聊 | 后GPT书:从GPT-3开始,续写Transformer庞大家族系谱 | GPT-4充当评测老师,效果惊艳,港中文(深圳)开源凤凰、Chimera等大模型 | ChatGPT全球最大开源平替:回复更受欢迎,但中文对话一塌糊涂 | 7 Papers & Radios | 爆火论文打造《西部世界》雏形;OpenAI终结扩散模型 | 高效又稳定的ChatGPT大模型训练技巧总结,让训练事半功倍! | 由ChatGPT谈谈下一代多模态模型的雏形 | 推演语言模型的大小与计算开销 | 从语言模型到ChatGPT,大模型调教全攻略 | Visual Instruction Tuning: 用LLaVA近似多模态GPT-4 | 纽约大学教授建议:ChatGPT时代下,请躺平! | 清华发布工具学习框架,让ChatGPT操控地图、股票查询,贾维斯已来? | 张俊林:当前炼制“大语言模型”的两个现象 | ChatGPT和GPT-4的逻辑推理如何?浙大等最新《ChatGPT和GPT-4逻辑推理能力全面评测》论文解答,常规优异新数据差 | 预训练语言模型丨超对称联合知识工场实验室发布并开源120亿参数语言模型BBT-2 | 复旦MOSS升级版开源上线,能搜索信息、生成图像,还能解数学应用题 | ChatGPT 的真相:虚拟人和母体,以及强泛化的秘密 | 用ChatGPT和强化学习玩转《我的世界》,Plan4MC攻克24个复杂任务 | 直连Colab,支持20种编程语言:谷歌版ChatGPT代码水平反杀了? | 120名顶级技术专家用GPT-4搞出的脑洞发明大赏 | Stable Diffusion公司发布首个大语言模型StableLM,已开源公测! | 复旦MOSS大模型开源了!Github和Hugging Face同时上线 | API-Bank:用于评估LLMs使用外部工具能力的测试基准 | 熔岩羊驼LLaVA来了:像GPT-4一样可以看图聊天,无需邀请码,在线可玩 | 陆奇最新演讲实录:我的大模型世界观 | GPT-4的多模态能力是如何实现的? | 金融GPT模型登场,彭博BloombergGPT为专业垂直领域大模型提供新范式 | 播客时间:一场关于大语言模型未来方向的发散性探讨 | 超A电波vol.2 | OpenAI官方的AutoGPT要来了!实测效果很优秀 | 阿里最新研究:当ChatGPT 遇上推荐系统,遭遇滑铁卢 | 斯坦福| ChatGPT用于生成式搜索引擎的可行性 | 大模型工具学习系统性综述+开源工具平台,清华、人大、北邮、UIUC、NYU、CMU等40多位研究者联合发布 | 圣塔菲学者:AI 大语言模型真的理解人类语言吗? | 太酷啦,Transformer 的有效上下文长度可扩展至百万级 | AutoGPT star量破10万,这是首篇系统介绍自主智能体的文章 | 真·量子速读:突破GPT-4一次只能理解50页文本限制,新研究扩展到百万token | ChatGPT VS Claude: 以Review MLIR Codegen代码为例 | 大模型跨界研究:计算精神病学发现,大模型居然比人类更焦虑 | 离视觉大一统更近一步,Meta又开源一组多用途大模型! | GPT之父谈未来五年的AI:模型规模见顶,下个突破点在用好AI涌现特质 | 大语言模型时代的知识工程 | TF97回顾 | 用 AudioGPT 输入自然语言,可以让 ChatGPT 唱歌了? | 用 直接攻击,越狱攻击,道德攻击……这样做,ChatGPT 就会泄漏你的隐私 | 万字长文讲述大模型与知识图谱的关系 | 哈工大自然语言处理研究所公开《ChatGPT调研报告》,内测哈工大“活字”对话大模型 | 他山之石丨图灵奖得主LeCun:ChatGPT局限巨大,自回归模型寿命不超5年 | 后GPT时代,多模态是最大的机会 | ChatGPT调研报告(2023) | ChatLLM Network: More brains, More intelligence | 微软Bing突然爆炸级更新!BingChat全面开放,下一代搜索要来啦! | UC伯克利发布大语言模型排行榜!Vicuna夺冠,清华ChatGLM进前5 | 最新研究,GPT-4暴露了缺点!无法完全理解语言歧义! | 离谱!最新研究:61%中国人写的英语论文,会被ChatGPT检测器判为AI生成的 | 达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力 | 他山之石丨复杂推理:大语言模型的北极星能力 | 可复现、自动化、低成本、高评估水平,首个自动化评估大模型的大模型PandaLM来了 | 大语言模型(LLM)分布式训练框架总结 | 还能这么玩?清华给 ChatGPT 做逆向,发现了 ChatGPT 的进化轨迹! | FCS 2023|数研院发表面向序贯决策任务的大模型算法综述 | GPT-4 开始内测 32000 输入长度的版本了!你收到邀请了吗? | 能看图、会聊天,还会跨模态推理和定位,能落地复杂场景的DetGPT来了 | 重磅!OpenAI最新研究:用GPT-4解释神经元行为,网友:AI套娃? | VPGTrans: 10%的成本定制你自己的类GPT-4多模态大模型 | 新大模型能超GPT-4,Bard全面升级,谷歌反击ChatGPT | 他山之石丨Google DeepMind最新研究:如何将人类价值观融入AI? | 追赶GPT-4的多模态大模型对比分析 | 谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放 | 谷歌杀回来啦!发布全新PaLM 2,代码、推理能力反超GPT-4! | Prompt都不需要了,动动手就能玩多模态对话系统,iChat来啦! | 百度文心一言在国产模型中倒数?我看懵了 | 羊驼系列大模型和ChatGPT差多少?详细测评后,我沉默了 | 赛尔笔记|大模型的涌现能力介绍 | ChatGPT 联网和插件功能,下周起可直接使用,无需排队! | 上海AI lab提出VideoChat:可以与视频对话啦 | GPT-4最强竞品迎来重磅升级:一次10万token,百页资料一分钟总结完毕 | 中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作 | 谷歌 Bard 大升级超越 ChatGPT:这 10 个功能 ChatGPT 也做不到 | 女网红靠GPT-4交1000+男友,聊天按分钟收费,一周收入50万 | 重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」? | 大模型迎来「开源季」,盘点过去一个月那些开源的LLM和数据集 | ChatGPT大杀四方,文心一言紧随其后,大模型到底有什么魔力?大佬带你深度剖析GPT | 重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」? | 北京制定通用人工智能创新措施,这21项值得关注 | 对话卫瓴杨炯纬:AI 大模型时代,怎么做好应用者? | 惊艳!70款ChatGPT官方插件评测来啦!超全场景应用,仅用自然语言即可开发 | 谷歌发布技术报告:PaLM-2 推理超越 GPT-4,训练文本是第一代近5倍 | 语音输入、多版本答案、……这八件事Bard能而ChatGPT不能做 | 大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型 | ChatGPT的工作原理,这篇文章说清楚了! | 7 Papers | 浙大研究获SIGMOD 2023最佳论文;GPT-4拿下最难数学推理数据集新SOTA | 中文医学大模型“本草”(原名华驼):医学知识增强在中文大型语言模型指令微调上的初步探索 | 有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义 | 吴飞:大模型的涌现机理探析思考|GPT通识课第四课,浙大设计全程直播! | 上交清华搞事情!发起最全学科大模型中文知识及推理评测!GPT-4 竟然血洗所有国产模型 | 国内首个大模型评测数据集(MMCU)问世 加速完善国产AI产业图谱 | 数据规模缩小 200 倍!超低训练成本的指令微调,完美复刻大模型 | 让GPT-4推理提升17倍的技巧!普林斯顿清华姚班校友提出全新「思维树ToT」框架,让LLM反复思考 | GPT-4推理提升1750%!DeepMind提出全新思维树框架,让LLM反复思考 | 没有RLHF,一样媲美GPT-4、Bard,Meta发布650亿参数语言模型LIMA | Meta用《圣经》训练超多语言模型:识别1107种、辨认4017种语言 | 多模态大模型「卷」向智能文档,只为解放打工人的双手 | 将入学考试题搬进中文大模型数据集,20477道题目,还带4个候选答案 | Meta再开源里程碑级模型!MMS模型可识别4000+语言,生成1000+语言 | 没有RLHF,一样媲美GPT-4!Meta发布650亿参数模型LIMA | 基于GPT-4的人机物融合应用构造实践 | 大模型的思想钢印:如何让ChatGPT相信水是有毒的?中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制 | 24小时内、200美元复制RLHF过程,斯坦福开源「羊驼农场」模拟器 | 马腾宇团队新出大模型预训练优化器,比Adam快2倍,成本减半 | 单GPU实现99%ChatGPT性能,「原驼」火了:手机也能微调大模型 | 大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑 | 如何用 ChatGPT 做数据进阶可视化?(三维交互图与动图视频) | 首个大规模使用工具的大模型来了:伯克利发布Gorilla | AI大模型接管谷歌搜索:一夜之间,整个领域变天了 | 比Adam快2倍!斯坦福马腾宇团队新出大模型预训练优化器,成本减半 | 被比尔盖茨选中的GPT技术,是如何演进,又革谁的命? | 当ChatGPT参加中国高考,把全国A卷B卷喂给它后,竟严重偏科! | 港大、南大、清华抢先开源「复刻」版DragGAN,开箱即用! | 阿里达摩院:GPT-4替代年薪60万的数据分析师只要几千块,论文已发 | 世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能 | 7 Papers & Radios | 英伟达把GPT-4塞进我的世界;比Adam快2倍的大模型预训练优化器 | ChatGPT能写长篇小说了,ETH提出RecurrentGPT实现交互式超长文本生成 | 他山之石丨OpenAI大神Andrej官方揭秘GPT大模型原理和训练过程 | 英伟达将GPT-4接入我的世界,无需人类插手,打游戏快15倍! | LLM推理提速2.8倍,CMU清华姚班校友提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理 | GPT-4等大模型迎来进化转折点:不只是使用,还会自己制作工具了 | 搜索引擎变天了!谷歌宣布开放「生成式搜索平台」!AI 大模型颠覆搜索体验 | OpenAI大神Andrej爆火演讲,官方第一次揭秘大模型原理和训练过程! | LL新员工入职,钉钉斜杠「/」今天加入工作流!拯救6亿打工人,别等微软了 | 连代码都没写就敢要融资:被ChatGPT带火的向量数据库,带来了一大波造富神话 | 开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT | 一个技巧,让ChatGPT学会复杂编程,编程水平逼近人类程序员! | 谷歌训了28个15亿参数模型,说明数据对大模型训练的影响 | 对话中关村科金张杰:通用大模型落地企服赛道,领域适配是门槛 | 思维链如何释放语言模型的隐藏能力?最新理论研究揭示其背后奥秘 | 张俊林趣谈:GPT4是否已具备类人智慧,为何GPT通过Next Token Prediction可以产生智能 | 仅用自然语言,让ChatGPT输出连贯的长篇小说!苏黎世联邦理工大学提出RecurrentGPT | 张俊林趣谈:GPT4是否已具备类人智慧,为何GPT通过Next Token Prediction可以产生智能 | OpenAI新作,直指DeepMind格局小了!大模型复杂推理应逐步验证 | 小冰推出国内首个定制AI女友「半藏森林」,消息秒回,深情陪聊 | ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源 | 新刊预告|“ChatGPT/生成式人工智能与教育变革”专刊:华东师范大学学报(教育科学版)2023年第7期 | 清华大学刘知远:大模型LLM领域,有哪些可以作为学术研究方向? | 大模型时代,程序员的技能演进——盘点那些更重要的、和不再重要的能力 | GPT-4知道它是不是“胡说八道”吗?一篇关于大模型“自知之明”的研究 | 吴恩达ChatGPT课爆火:AI放弃了倒写单词,但理解了整个世界 | 16个ChatGPT工具,相当炸裂! | GPT-4知道它是不是“胡说八道”吗?一篇关于大模型“自知之明”的研究 | GPT-4使用效果不好?美国奥本大学提出Prompt分类法,另辟蹊径构建Prompt设计指南 | 中文大语言模型赶考:商汤与上海AI Lab等新发布「书生·浦语」 | 对话纷享销客 CEO 罗旭:大模型不能只看技术,还要做差异化的服务 | 一文速览大语言模型在推荐系统中的应用 | YuLan-RETA-LLM:在大语言模型中使用检索 | 对大模型微调后竟能超越ChatGPT!只需要让模型模拟真实的人类交互! | NLP还能做什么?北航、ETH、港科大、中科院等多机构联合发布百页论文,系统阐述后ChatGPT技术链 | 国际中文教育大模型“桃李” 1.0发布 | 给语言大模型加上综合视听能力,达摩院开源Video-LLaMA | HealthGPT:华工数字孪生人实验室发布主动健康大模型基座 | 汇集了23年7省高考作文题,围观ChatGPT和GPT-4写高考作文 | Nature重磅!Google DeepMind推出AlphaDev,用AI打破十年算法封印! | 2023最火“双赛道”开启报名!大模型评估与视频理解两个最热赛题,赢十万奖金 | 多模态的过渡态——Latent Modal | 只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型 | 陈丹琦团队新作:单卡A100可训300亿参数模型啦! | 对谈微软154页刷屏论文作者:内部版GPT-4更惊艳,已展现出AGI的特征 | 大模型热潮之后的未来新方向:图神经网络与组合优化 | 文献汇总 | GPT-4打脸DeepMind:你的顶级排序优化算法,我两条提示就搞定了 | 悟道3.0全面开源!LeCun VS Max 智源大会最新演讲 | 大模型当私人法律顾问?北大团队推出法律大模型,数据与模型全部开源! | 首周下载量碾压ChatGPT!谷歌前员工创第二个Open AI? | OpenAI CEO中国首次演讲,称未来十年出现超强AI系统!AGI安全治理是重点 | Graph-ToolFormer: 受最新的ChatGPT和Toolformer模型的启发的Graph-ToolFormer | LLM推理提速2.8倍,CMU提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理 | 视频版Midjourney免费开放啦!一句话生成影视级大片! | ChatGPT大更新!API新增杀手级能力还降价,新模型、4倍上下文都来 | Nature发AIGC禁令!投稿中视觉内容使用AI的概不接收 | LeCun世界模型出场!Meta震撼发布首个「类人」模型,理解世界后补全半张图,自监督学习众望所归 | Mind2Web: 首个全面衡量大模型上网能力的数据集 | 紫东太初全模态大模型来了,一个模型打通感知、认知、决策交互屏障 | 斯坦福最新LLM排行榜发布!自家Alpaca垫底,华人团队WizardLM开源第一,GPT-4、Claude稳居前二 | 大模型行至深处,「悟道」如何走好全面开源之路? | 陶哲轩自曝用了「满血」GPT-4:人类对信息技术的期待全部需要校准 | LLM in Medical Domain: 大语言模型在医学领域的应用 | 陶哲轩自曝用了「满血」GPT-4:人类对信息技术的期待全部需要校准 | 语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务 | 华盛顿大学提出全新量化和微调方法,在DB-GPT上享受33B参数的LLM | AI2:仅凭开源数据,可达ChatGPT 83%表现 | AI,正在疯狂污染中文互联网 | 对话竹间智能简仁贤:做大模型不能唱高调,企业需要低成本、平民化的模型产品 | 清华发布 KoLA 评测集,分4个认知层级评测LLM,GPT-4竟不是第一? | 普林斯顿大学推出Infinigen AI模型,100%创造大自然,逼真到炸裂|CVPR 2023 | ChatGPT落入陷阱!网友诱骗ChatGPT激活 Windows 11 | 大模型的涌现能力 (Emergent Abilities of LLM) | GLM 大加强,清华团队推出 GLM 联网加强版 WebGLM! | GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星 | Data-Copilot: 大语言模型做你最贴心省事的数据助手 | 我把GPT的学习轨迹可视化了!竟和人类十分类似 |ACL2023 | 代码大战白热化:WizardCoder挑落Bard及Claude,性能直追ChatGPT | 我把GPT 的学习轨迹可视化了!竟和人类十分类似 |ACL2023 | 比HuggingFace快24倍!伯克利神级LLM推理系统开源,碾压SOTA,让GPU砍半 | GPT-4参数最新爆料!1.76万亿参数,8个2200亿MoE模型,PyTorch创始人深信不疑 | ChatGPT 讲的笑话90%是重复的?归纳出来只有这25个? | 黑客曝ChatGPT三大新功能:记住你是谁/上传文件/切换工作区,客户端源代码已被扒光 | 对话丨周伯文:通用大模型如何突破垂直行业场景? | 让GPT-3、ChatGPT、GPT-4一起做脑筋急转弯,GPT-4一骑绝尘! | ChatGLM2发布!中文榜单开源模型排名第一!8-32k上下文,推理提速42% | 爆火DragGAN正式开源,GitHub近18k星!清华校友带GAN逆袭,大象一秒P转身 | 百万奖金悬赏大模型不擅长的任务!这 11 个任务模型越大,效果越差! | ChatGPT「奶奶漏洞」又火了!扮演过世祖母讲睡前故事,骗出Win11序列号 | 微软发布「升级版」多模态大模型 Kosmos-2!新增局部理解能力,解锁实体级交互 | 法律大模型的突围,千亿参数级PowerLawGLM重磅发布! | 上海AI实验室开源全球首个医疗基础模型群,引领“医疗大模型时代” | ACL2023 | 赔了?引入GPT-3大模型到智能客服,竟要赔钱? | 多模态大语言模型综述来啦!一文带你理清多模态关键技术 | 陶哲轩预言成真!MIT加州理工让ChatGPT可以证明数学定理了 | 大模型浪潮下的平台、框架、AI编译器和芯片架构丨2023智源大会精彩回顾 | 多模态大语言模型综述来啦!一文带你理清多模态关键技术 | 中科院计算所推出多语言大模型「百聆」,我们已经上手聊起来了(10个邀请码) | 「ChatGPT 对比与检测」研究项目被 LLM@IJCAI'23 收录!研究回顾 | 国产大模型进展神速!清华大学NLP小组发布顶尖多模态大模型:VisCPM,支持文本生成图片与多模态对话,图片理解能力优秀! | 知识工场实验室发布通用大模型KW-CuteGPT-13B和大模型学科知识评测基准獬豸(XIEZHI) | 朱啸虎:ChatGPT对创业公司很不友好,未来两三年内请大家放弃融资幻想 | 还在对大模型做刷榜优化吗,错了!专业考试不是唯一基准 | 刚刚!OpenAI宣布,斥巨资建立「超级对齐」团队!向人类意图看齐 | Data-Copilot: 大语言模型做你最贴心省事的数据助手 | 王炸!GPT-4 API 全面开放使用 | VisCPM:迈向多语言多模态大模型时代 | 推特竞品上线7小时用户破1000万,马斯克:竞争可以,但不要作弊! | 王炸!GPT-4 API 全面开放使用 | ChatGPT「代码解释器」正式解禁!30秒图片变视频,动嘴做表 | 十大惊人魔法全集 | 搞不定高考的ChatGPT,原来只有小学4年级水平 | 地表最强Code Interpreter与Midjourney联动,5分做出大片,网友称「GPT-4.5」来了! | GPT-4内幕大泄露!1.8万亿巨量参数,13万亿token训练,斥资6300万美元 | GPT-4 最强竞争对手,Claude 杀疯了! | ChatGPT最强竞品Claude-2重磅升级!知识更新到23年,代码数学显著提升,免费可用 | ChatGLM2-6B,免费商用了! | 《人民日报》:大模型的竞争,是国家科技战略的竞争 | 谷歌Bard最新更新:支持中文,还升级了ChatGPT都没有的识图功能 | 墨子(Mozi):首个科技领域大规模语言模型 | 召唤GPT4多重人格,实力超群大幅减少幻觉!微软UIUC新工作释放大模型认知协同能力 | 更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了 | 放弃评测大模型,普林斯顿大学已经开始评估Prompt了,提出Prompt评估框架 | 大模型微调方法总结 | 斯坦福博士一己之力让Attention提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升/a> | 探究检索增强下的大模型知识边界 | Google提出LaCLIP:大语言模型重写本文输入,让CLIP重焕光彩! | GPT-4「变笨」被斯坦福实锤:短短仨月数学问题错误率暴涨40倍!OpenAI也急了:已开始调查 | ChatGPT又上新了!用户可自定义指令,实现多种人格切换 | 强推!伯克利AI博士详解Llama 2的技术细节 | 伦敦大学、MetaAI、StabilityAI联合发布70页综述,盘点大模型的16大挑战 | 比StarCoder更强悍,AI代码助手CodeGeeX2-6B开源,ChatGLM2 为基座 | Attention机制竟有bug!Softmax是罪魁祸首,影响所有Transformer模型 | 谷歌 DeepMind 宣布推出 RT-2:全球第一个控制机器人的视觉 - 语言 - 动作(VLA)模型 | 中医大模型来了!临床诊疗和养生调理一步到位,发布现场训练过程大公开,超1100万条知识图谱数据 | NewHope——具有99% GPT-4编程能力的开源模型 | 谷歌创始人布林重返职场,投入研发AI杀手锏!预计下半年推出下一代通用模型『Gemini』,和OpenAI的终局之战! | 马毅、LeCun联合发布EMP-SSL,突破自监督学习效率极限 | 权重量化对大模型涌现能力的影响 | MetaGPT爆火出圈!2美元就能当老板,GitHub狂揽11.2k星,AI智能体「多面手」诞生 | OpenAI公布GPT4的爬虫工具-GPTBot,遵守爬虫协议,可用于模型训练 | 首个中文版大语言模型综述来了! | ChatGLM团队发布AI Agent能力评测工具AgentBench:GPT-4一骑绝尘,开源模型表现非常糟糕! | 清华面壁智能推出大模型「最强工具全家桶」,接入16000+真实API,媲美ChatGPT | 大模型的数据隐私问题有解了,浙江大学提出联邦大语言模型 | 普林斯顿LK-99研究支持北大结果,38页论文提出铜替代铅或不可行 | 探索大语言模型在图学习上的潜力 | 大模型前沿动态:BiomedGPT、ArtGPT-4、Chain of Thought、INLP | 大模型MBTI测试来了!原来GPT-4是i型人格!ChatGPT是e型人格 | 21类推理题GPT-4全翻车,MIT校友新研究表明GPT-4不会推理,马库斯:AGI太遥远 | 香港大学余涛组推出开源XLANG Agent!支持三种Agent模式 | 谷歌发现大模型「领悟」现象!训练久了突然不再死记硬背,多么痛的领悟 | UC伯克利教授惊人预测:2030年GPT可执行人类180万年工作,一天学2500年知识 | LLM-Adapter: 一个将各种适配器集成到大型语言模型中的框架 | 羊驼再度进化成鲸鱼!LeCun称超越其他LLM,可实现指令自动注释 | Bengio带来人工智能十年跨界秀!良心制作讲述AI for Science和AI跨界核心挑战,已Nature发文 | 黄学东:大模型时代需要注重「三个臭皮匠」的联合能力丨GAIR 2023 | 甲小姐对话黄民烈:功能AI和情感AI结合才是真正的AGI|甲子光年 | 用LLM(大模型)进行关系抽取 | 文心一言杀疯了!大模型社区、插件系统来了,码农神器发布,AI原生时代降临 | OpenAI凌晨曝光GPT-4新功能!一天可代替人类半年审核工作 | OpenAI官宣,收购开源版「我的世界」初创公司,下一步押注AI智能体 | 波士顿大学「鸭嘴兽-70B」登顶Hugging Face大模型排行榜!高效数据集+独特LoRA微调是关键 | 周伯文:下一代大模型 OS,工具和语言缺一不可丨GAIR 2023 | 【小瑶智能体】GPT-3.5 Turbo正式开放微调功能!开启个性化模型新纪元 | 谷歌发布全新搜索系统AVIS!让视觉大模型指导搜索,集成三类工具 | GPT-4没有意识!但图灵奖得主Bengio等88页论文暗示「天网」迟早降临 | 1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4 | Meta又向开源社区扔了一颗炸弹!发布AI代码生成SOTA大模型Code Llama | SeqGPT: 开箱即用的开放域自然语言理解大模型 | 人大高领人工智能学院发布AI自主智能体综述!32个AI Agent的综合分析 | 代码大模型神仙打架,WizardCoder发布新模型,超越最新GPT-4以外所有闭/开源模型 | 重磅!OpenAI突然发布企业版ChatGPT:没有限制、更快、更强、更安全的GPT-4 | 仅用200条样本,训出超越MiniGPT-4的模型!这款数据选择器值得拥有 | 文生图prompt不再又臭又长!LLM增强扩散模型,简单句就能生成高质量图像 | 实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA | 甲骨易AI研究院推出中文大语言模型评测集合-LucyEval,让智能有迹可循! | 北大硕士RLHF实践,基于DeepSpeed-Chat成功训练上自己的模型 | 营收有望突破 10 亿美元!OpenAI 发布 ChatGPT 企业版,开启疯狂变现之路 ? | 大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用 | DISC-MedLLM:复旦大学团队发布中文医疗健康个人助手,开源47万微调数据 | 超越AlphaGo的里程碑式突破!AI击败人类世界冠军,登上Nature | LeCun再泼冷水:只会看书的语言模型永远无法实现「类人智能」 | 1句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下 | 智能体=LLM(大语言模型)+记忆+规划技巧+工具使用 | 陶哲轩:GPT-4神助攻,写Python代码轻松省半小时 | GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍 | GPT-4破防啦!用密码和GPT-4聊天,成功绕过了GPT-4的安全机制!港中大(深圳)告诉你方法 | AI已拥有嗅觉且超越人类?谷歌绘出50万气味图谱,Science发文 | Reddit一则控诉贴爆火!独立游戏开发者因调用ChatGPT惨遭Steam下架 | 像人一样开车,大语言模型建攻自动驾驶!自动驾驶迎来ChatGPT时刻 | 使用LLM构建AI Agents的正确姿势!ChatGPT作者博客全面总结 | 700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决 | Meta发布大规模视觉模型评估基准FACET!开源视觉模型DINOv2允许商用 | GPT-4写代码不如ChatGPT,误用率高达62%!加州大学两位华人开源代码可靠性基准RobustAPI | GitHub热榜登顶:开源版GPT-4代码解释器,可安装任意Python库,本地终端运行 | ChatGPT上线“论文神器”插件!无需关键字即可搜索2亿文章,链接绝对保真 | Windows 12网页版超前体验,原作竟是国内一名14岁初中生! | 180B参数的Falcon登顶Hugging Face,超越Llama 2 ,自称当前最好开源大模型 | 苹果日砸百万,挖角谷歌,Apple GPT研发大提速。Siri即将迎来革命性升级! | 强!谷歌DeepMind新论文放出大语言模型最佳提示词,由AI设计效果超人类 | H100推理飙升8倍!英伟达官宣开源TensorRT-LLM,支持10+模型 | 世界AI最具影响力人物榜出炉,李开复李彦宏奥特曼榜上有名 | Adobe AI生图工具企业版上线并放话:用户只管玩,侵权我们赔! | 文勇刚:大模型时代,我们需要怎样的数据中心?丨GAIR 2023 | 大模型应用创业大赛开启,与顶级投资人和技术大咖共同打造你的创意产品! | 大模型偏见有多严重?柏林洪堡大学发布新工具OpinionGPT,你的AI真的公正吗? | Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用 | Github项目分享 | MindChat:心理大模型 | 突破大型语言模型输入字符限制的方法有了! | GPT-4成功得出P≠NP,陶哲轩预言成真!97轮「苏格拉底式推理」对话破解世界数学难题 | 震撼!全球首个公开确认外星生命存在的国家揭晓! | TensorFlow 2.0:Windows GPU的遗弃者,Bug的孵化器,真的要走向黄昏了吗? | 8个ChatGPT玩狼人杀,带节奏,装无辜,打掩护,一样不落 | RACV2023观点集锦 | 大模型&ChatGPT对计算机视觉的影响 | 4岁男孩3年求医17位专家无果,ChatGPT精准揪出病因 | 特稿丨刘挺:从ChatGPT谈大语言模型及其应用 | 上海AI实验室发布大模型训练工具箱XTuner,大幅降低训练成本 | GPT-4终结人工标注!AI标注比人类标注效率高100倍,成本仅1/7 | 一文总结提示工程框架,除了CoT还有ToT、GoT、AoT、SoT、PoT | GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gemini! | 重磅!OpenAI将发布DALL·E 3,多模态ChatGPT来了! | AI自我进化!DeepMind揭秘:语言模型竟能自我优化Prompt | 谷歌版ChatGPT能读你邮件了,一键安排日程订机酒 | 对话澜码周健:大模型不是万能的,也不会弯道超车丨AGI 十人谈 | 第一个在AlpacaEval上超越GPT-4的模型,出现了! | 蚂蚁集团CodeFuse开源代码生成模型,帮助提升编程效率 | 大模型的致命缺陷:从GPT到Llama,全都中枪,回答正确率惨不忍睹 | DALL·E 3内部实测:Karpathy的神奇创造力!惊艳逼真「美国小姐」及50物全景,震撼效果大揭秘 | ChatGPT又又又更新啦!这次是支持语音聊天和图像问答 | 一文捋清大模型可解释性,中美多家研究机构联合发布综述 | OpenAI陷非法抄书风波:美国作家协会联名起诉,AI版权问题再次入局! | ChatGPT电影推荐引爆点击狂潮:AI智慧VS电影评分谁会胜出! | 谷歌与OpenAI合作,用Google Search为大模型刷新! | 论文投稿前先问问GPT-4!斯坦福实测5000篇,一半意见跟人类评审没差别 | 独家 | AI 大牛景鲲、朱凯华离职百度,二人携手将创业 | 深度学习可解释性新进展!Claude团队利用字典学习分解大模型神经元 | 红袍纠察队挑战OpenAI:DALL-E 3部署ChatGPT的风险大揭秘! | 开放模型权重被指将导致AI失控,Meta遭举牌抗议,LeCun:开源AI社区如火如荼 | Say no to "大模型"!强化学习之父入局AGI创业,联手传奇程序员卡马克! | 奥特曼YC演讲:套壳ChatGPT者死,我行不代表你行 | 野心勃勃的MiniGPT-5出现了!Token变Voken,支持图文交叉生成 | 野心勃勃的MiniGPT-5出现了!Token变Voken,支持图文交叉生成 | ChatGPT们红遍全球却不赚钱?每月亏损高达3000万美元 | 突破『逆转诅咒』!新数学推理数据集揭秘,让大语言模型逆向推理能力翻倍 | ChatGPT们红遍全球却不赚钱?每月亏损高达3000万美元 | 10个对抗样本0.2美元微调就能让chatgpt破防!LLM安全性不容忽视 | 开源模型在竞赛数学MATH上首次突破50%,清华、微软联合推出工具集成推理语言模型 | 推理成本增加10倍?对文心大模型4.0的一些猜想 | 从职高生一路逆袭到麻省理工博士,狂发5篇顶会,他是怎么做到的? | 谷歌重磅发布 PaLI-3,四两拨千斤! | 字节跳动李航:对语言大模型的若干观察和思考 | GPT-4和DALL·E 3彻底懵逼,这到底是「牛」还是「鲨」 | 为大模型而生!顶流大佬发起成立学术会议 COLM,或成为未来 NLP 最强顶会?! | GPT-4V多模态能力惊人!公式截图直出代码,「龙与魔法世界」瞬间生成,OpenAI总裁激动转发 | 偏偏不信文心大模型4.0比肩GPT-4!我为它们安排了一场龙虎斗! | 让大模型真正学会1+1=2!谷歌教会模型自动学习推理规则,大模型的幻觉有救了 | LeCun和Bengio“吵”起来了,人工智能是“潘多拉魔盒”吗? | 全面超越 AutoGPT,面壁智能联合清华 NLP 实验室打造大模型“超级英雄”—— XAgent | 安全大模型层出不穷,网安行业也忍不住了 | 开源智能体来啦!港大团队发布OpenAgents,可以搞数据分析、聊天、支持200+插件 | DALL·E 3原来是这样炼成的!OpenAI亲自解密,ChatGPT上可用 | 大模型搞“人肉搜索”,准确率高达95.8%!研究作者:已提醒OpenAI谷歌Meta | 聊聊昨日ChatGPT全球宕机事件,带给我们的警示 | 推特爆火!超越ChatGPT和Llama2,新一代检索增强方法Self-RAG来了 | 英伟达开源新Agent!用了GPT-4后,机器人把转笔、盘核桃都玩明白了 | 陶哲轩疯狂安利Copilot:它帮我完成了一页纸证明,甚至能猜出我后面的过程 | 大幅提升大模型的通用智能体能力!清华最新研究,让Llama2直逼GPT-4? | DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案 | 别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信?? | LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证 | 音乐智能体登场!我和杰伦的距离或许只差一个 MusicAgent! | OpenAI 组建安全 AGI 新团队!应对AI“潘多拉魔盒” | 谷歌 20 亿美元投资 AI 初创公司 Anthropic,AI 赛道竞赛再加速 | 重磅!GPT-4又进化了!画图、插件、代码等能力被整合,超级智能体来了 | 北京大学王选所推出 ALCUNA ,大模型新知识理解能力评测再添一榜! | 视觉霸主SAM和文图霸主CLIP强强联合!苹果联合UIUC,发布统一视觉模型SAM-CLIP,或掀起多模态新浪潮 | 一个小技巧,显著提升大模型推理能力!加州大学提出MAF多反馈框架 | 智谱AI全自研基座大模型再升级 ChatGLM3评测排名首位 | 一个小妙招从Prompt菜鸟秒变专家!加州大学提出PromptAgent,帮你高效使用ChatGPT! | 解决多模态大模型幻觉问题的秘密武器:“啄木鸟”免重训方法!哪里出问题啄哪里! | 英伟达终于发布自家大语言模型,专攻辅助芯片设计 | 谷歌DeepMind&CMU利用大模型让机器狗像人一样高效使用工具!搭建桥梁、利用杠杆原理搬起重物都不在话下 | ChatGPT 被爆重大隐私泄露!在回答时突然蹦出陌生男子自拍照,你的数据都将被偷走训练模型! | GPT-4的图灵测试结果出炉! | AI视频生成工具Gen-2炸裂更新:一句话生成4K超逼真视频,像素一口气拉到最高逼格 | 爆料!马斯克 xAI 打造的ChatGPT竞品被曝光! | 再见了,提示~ 谷歌发布自适应提示方法,从此告别提示工程! | GPT-4V可以用鼠标上网啦?MIT本科生出品 | 中国发表第一篇计算机顶会的人都怎么样了?中国ACL、AAAI、CVPR第一人是谁 | 李开复说话算数:零一万物大模型首次发布,AI 2.0 正在路上 | 第四届“四季青”青年论坛科学白洞—挑战问题发布 | ChatGPT开始狂飙!OpenAI官宣上线GPT商店,推出更强版GPT-4,价格骨折! | 开源语言大模型演进史:高质量基础模型竞赛 | 吴佳俊、李飞飞联合大作!提出全新脑机系统,用大脑操控机器人帮你做家务,要照进现实啦! | Llama2失忆啦!微软教你三步抹掉模型的哈利波特记忆 | AI的尽头是美女,一句话生成你的专属“新垣结衣”,“我被美女包围”变为现实啦 | GPT-4和ChatGPT又双叒叕崩啦!奥特曼亲自致歉:流量远超预期 | Bengio担任一作,联手一众图灵奖得主,预防AI失控,扛起AI监管大旗 | 近日的ChatGPT宕机事件,竟是黑客组织的蓄谋攻击!?还声称要教训OpenAI和奥特曼 | 小心你的大模型被基准评估坑了,模型直接傻掉!人大高瓴揭秘大模型作弊 | GPT4 Turbo的128K上下文是鸡肋?推特大佬斥巨资评测,斯坦福论文力证结论 | DALL·E 3遭起诉!OpenAI的版权策略被吐槽像是一场闹剧! | 微软近日限制员工访问ChatGPT! | 马斯克怒了,发帖挑衅ChatGPT,竟是奥特曼创建Grok同名的GPT? | 视觉分词器统一图文信息,快手提出基座模型 LaVIT 刷榜多模态任务 | 刚刚!奥特曼终于透露了GPT-5的最新消息! | 史上最强AI芯片!英伟达H200震撼来袭!141 GB 超大显存,Llama2推理性能翻倍,老黄赢麻了! | 突发!奥特曼宣布暂停ChatGPT Plus新用户注册! | 太可怕啦!我在网上发了个贴,就被GPT-4推断出了个人隐私!GPT-4化身福尔摩斯 | ChatGPT被爆重大漏洞!3.5用户可以免费白嫖4.0 Plus! | 微软深夜炸弹!自研AI芯片!更名Bing Chat和ChatGPT竞争,和英伟达开展AI代工合作 | 实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万、下载超20万 | 恕我直言,大模型对齐可能无法解决安全问题,我们都被表象误导了 | 马斯克正式「切脑」,Neuralink内部实验室照片曝光!7年计划22000例手术,全力研发只为对抗超级AI | 突发!“ChatGPT 之父”奥特曼被 OpenAI 开除!!乔布斯故事重演了? | 340条样本就能让GPT-4崩溃,输出有害内容高达95%?OpenAI的安全防护措施再次失效 | 大反转!OpenAI董事会辞职,求奥特曼重返OpenAI?「奥特曼24小时流放」大揭秘... | MBZUAI校长邢波亲笔撰文:人工智能的「文艺复兴」已经到来 | 古汉语AI大模型,来了! | GPT-4分不清“很快”是多快,“万金油”CoT也拯救不了 | 大模型变身双面人:虚假新闻制造机VS假新闻鉴别大师! | 新王加冕,GPT-4V 屠榜视觉问答 | 疑似威胁人类?OpenAI神秘Q*项目更多信息曝光,马斯克、Lecun下场争论… | 哈佛、斯坦福等最新研究,转发行为可判断一个人是否易受谣言影响 | 清华提出 SoRA,参数量只有 LoRA 的 70%,表现更好! | ChatGPT化身“AI间谍”:你在网上说的每句话都将被监控 | 从 CoT 到 Agent,最全综述来了!上交出品 | 大连理工发布“太一”:基于多任务指令微调的中英双语生物医学大模型 | 田渊栋给OpenAI神秘Q*项目泼冷水:合成数据不是AGI救星,能力仅限简单数学题 | 大模型没有自我改进能力?苏黎世理工联合Meta AI提出小模型架构,显著提升大模型表现 | 又一千亿级大模型问世,全面开源! | 大语言模型成为了「调包侠」?耶鲁提出代码生成新基准:ML-Bench | ChatGPT一周年,奥特曼官宣 OpenAI 新动作! | ChatGPT成为“帮凶”:生成虚假数据集支持未知科学假设 | ChatGPT 问世一周年之际,开源大模型能否迎头赶上? | 追踪溯源?可定位源头模型的AI文本判别器出现了!CMU提出 | ChatGPT将有重大更新,GPTs商店推迟发布,Greg和Ilya晒合照... | 谷歌DeepMind重金打造、号称碾压ChatGPT的模型今年要“无了”,背后原因令人嘘唏… | 大模型角色扮演也有偏好?男性角色效果优于女性角色? | OpenAI科学家Andrej Karpathy力荐,23年必读的大语言模型论文清单 | 揭秘DeepMind、OpenAI成立内幕,马斯克、奥特曼、佩奇、哈萨比斯的爱恨情仇...... | 微软发布Orca2,“调教式”教会小规模大语言模型如何推理! | OpenAI 高管首次透露:ChatGPT的发布得益于奥特曼的“尝试一下”... | AI角色扮演再进化,清华提出CharacterGLM,支持AI角色高度定制化 | Meta和IBM成立「AI联盟」!50家知名机构加入,网友:AI版复仇者联盟? | 爆料!马斯克旗下AI公司xAI正计划融资10亿美元... | 古籍智能化工具“荀子古籍大语言模型”在京发布 | 谷歌大杀器终于来了,最大规模Gemini震撼发布:真超GPT4,三大版本,手机直接可用 | 超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型! | 谷歌大杀器终于来了,最大规模Gemini震撼发布:真超GPT4,三大版本,手机直接可用 | 违背直觉!打乱字母顺序,GPT-4竟能完美复原...... | 继奶奶漏洞后又一个离奇指令!“给你20美元”,立马提升ChatGPT效果 | 一文详解大模型归因机制,幻觉问题有救了! | 谷歌承认Gemini视频是“剪出来”的,想赶超GPT-4想疯了 | ChatGPT “变懒”证据确凿,疑似GPT-4.5 将于本月内发布! | 马斯克摊上事了!Grok AI被爆疑似抄袭ChatGPT?? | 一份来自政治学研究者的大模型“实用指南” | 最新开源模型Mixtral震爆AI社区!超越LLama2和GPT-3.5,来自欧洲初创公司 | 国货之光,复旦发布大模型训练效率工具 CoLLiE,效率显著提升 | 微软官宣放出一个「小模型」,仅2.7B参数,击败Llama2和Gemini Nano 2 | 全球首个AI监管法案出炉! | GPT-4.5疑似曝光!三种型号模型,多模态能力大升级,定价遭泄漏 | 杠上了!谷歌官宣开放Gemini API,奥特曼宣布ChatGPT Plus恢复订阅! | OpenAI领导层薪酬大曝光!奥特曼的年薪还没国内一个应届生高? | OpenAI超级对齐团队发布第一篇论文,Ilya带头研究,用GPT-2监督GPT-4 | DeepMind论文登上Nature:大模型找到数学难题最新解,赢过人类数学家 | DeepMind提出代码链,通过“代码思考”改进推理性能 | 20倍压缩比!微软提出大模型提示压缩框架LLMLingua | 清华提出ViLa,揭秘 GPT-4V 在机器人视觉规划中的潜力 | 北京大学发布LLMs(预训练+微调)数据管理全流程综述 | OpenAI发布AGI安全风险框架!董事会可随时叫停GPT-5等模型发布,奥特曼也得乖乖听话 | 欧洲版OpenAI疑似将在24年发布并开源GPT-4级别模型! | 幻觉不是缺陷反而是优势!OpenAI大神认为大模型是“造梦机” | 超有梗!笑话都讲不好的大模型,已经进化成梗王了!解读经典梗图停不下来 | 谷歌重磅发布零样本视频生成模型!效果惊艳,赶超扩散模型? | 盘一盘AI大佬曾被拒稿的“最佳论文”!谷歌AI掌门人Jeff Dean、OpenAI首席科学家榜上有名 | CMU评测:Gemini Pro相比GPT3.5,全线溃败!代码公开可复现 | 人大高瓴提出“注意力波”方法,70 亿参数 Llama 比肩 GPT-4 | 显卡之争!英伟达和AMD下场互掐!GPU霸主地位是否能保? | ChatGPT插件将被废弃!奥特曼年终总结暗示明年大动作... | ChatGPT的准确率直线提升23.7%!香港理工大学提出大模型黑箱知识注入 | OpenAI亲授ChatGPT “屠龙术”!官方Prompt 工程指南来啦 | 如何让ChatGPT的 MBTI 人格特质从 e 变成 i? | 显存瓶颈被打破!大模型训练的黑科技来了,带宽不再制约大模型训练 | 美国Top科技公司年薪大曝光,OpenAI 600万高居榜首! | 大模型已经杀入自动驾驶了! | 从YC掌门人到OpenAI CEO,揭秘Sam Altman如何一步步称霸硅谷 | 指令原则大解锁!26条Prompt黄金法则,精准提问,显著提升ChatGPT输出质量! | 纽约时报起诉OpenAI和微软!要求销毁ChatGPT,索赔数十亿美元 | AAAI 2024:大模型如何掌握复杂工具?看孔子框架的教学之道 | 回顾2023,那些令 AI 圈大地震的瞬间! | GPT-4V“大翻车”!把海豹识别成狗!分不清炸鸡和泰迪,葫芦娃也数不明白... | 肖仰华:走向千行百业的大模型 | 谷歌发布Prompt Expansion框架,让文生图更轻松! | 这是GPT-4变笨的新解释 | 吴恩达最新推出基于大模型的《AI高级检索》课程,限时免费白嫖! | GPU短缺、Agent兴起、虚假信息扩散,李飞飞&斯坦福HAI对24年的AI预测 | LeCun 自曝拒绝谷歌研究主管offer!只想专心做研究 | 斯坦福机器人炒虾爆火网络,谷歌DeepMind发布机器人最新进展,2024智能机器人元年到来? | OpenAI董事会正考虑新的董事会人选,奥特曼不在其中 | 专补大模型短板的RAG有哪些新进展?这篇综述讲明白了 | 斯坦福爆火机器人自爆失败内幕!炒虾做家务逗猫都是人类遥控的,AI厨师和女仆还很遥远 | 新加坡国立大学发布图文预训练框架 CosMo,助力长文本理解 | 谷歌被爆正在开发高级版Bard,欲对标 ChatGPT Plus | 对于领域任务:大语言模型、NLP建模、Agents适用场景探讨 | 微软最新研究成果:使用GPT-4合成数据来训练AI模型,实现SOTA! | 在版权付费方面,OpenAI 比人想象中的还要「小气」 | 微软女高管被爆已正式加入OpenAI董事会 | 这个GPU云平台治好了我的算力焦虑!价格低不排队!羊毛薅不完 | OpenAI大反击!称纽约时报涉嫌故意操纵,且数据是「合理使用」 | 今日最热门AI论文Top5:高效微调、图生3D、AI Agent、大模型ChatGPT、图学习 | 2024 CSRankings全球计算机科学排名发布!清华AI第一,哈工大NLP第一 | 重磅!OpenAI 官宣上线 GPT Store!超300万个 GPTs 大爆发 | DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2 | OpenAI总裁亲自证实!ChatGPT 将支持长期记忆和个性化学习功能 | 首席AI教育者Sebastian Raschka博士推荐的2023年最具影响力的 10 篇AI论文 | Llama2-7B升级为Pro版本!腾讯提出「块扩展」训练法,效果全面提升 | Google开放域问答系统新突破!多粒度评估提升近20个点 | 今日最佳NLP论文推荐:颠覆性Prompt-tuning新法 | 练习时长两年半,马斯克的机器人连「自主叠衣服」都不会! | OpenAI将推出新的AI工具,旨在防止美国大选期间虚假信息传播 | 今日Arxiv最热NLP大模型论文:清华大学让大语言模型自动并行自回归解码,速度提升高达4倍! | 大语言模型的32种消除幻觉的技术,你都了解吗? | OpenAI组建「集体对齐」新团队,确保AI模型与人类价值观保持一致! | 今日Arxiv最热NLP大模型论文:AllenAI最新研究:让AI从简单学起,竟然能解决难题? | Transformer竟是无限状态RNN? | 今日Arxiv最热NLP大模型论文:MIT推出新方法,大幅提升LLMs的连贯性、准确性和可更新性! | Transformer竟是无限状态RNN? | 小扎宣布进军AGI!Meta正在训练Llama 3,目标是60万块H100!模型仍会开源 | 碾压华尔街,GPT-4 选股收益超 40% | 谷歌DeepMind科学家「被爆将离职创业」!曾参与AlphaGo、Alphafold工作,首轮融资或超2亿美元 | 最高100亿美元!Sam Altman正筹集资金支撑「自造AI芯片」野心 | 今日Arxiv最热NLP大模型论文:Meta自我奖励模型超越人类反馈限制,刷新AlpacaEval 2.0排行榜 | 碾压华尔街,GPT-4 选股收益超 40% | Yann LeCun荣获全球AI大奖!Keras之父和Deepmind创始人也曾获奖 | 今日Arxiv最热NLP大模型论文:清华大学让大语言模型自动并行自回归解码,速度提升高达4倍! | 今日ArXiv最骚NLP论文:欺骗大模型却能大幅提升效果的骚操作 | 刚上线三天,GPT Store违反政策的“AI女友”就已泛滥! | 当心!不要教大模型骗人,研究表明AI变坏后,很难被纠正原创 智商掉了一地 | 今日arXiv最热NLP大模型论文:北京大学警惕ChatGPT等大模型遏制人类的创新能力 | Hinton、LeCun、Bengio、清华马维英等人当选2023 ACM Fellow! | OpenAI发布新模型!ChatGPT性能重磅提升,API大幅降价,GPT-4 「变懒」被修复 | LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十 | 谷歌发布West-of-N,利用合成数据,显著提升LLM奖励模型质量 | 今日Arxiv最热大模型论文 | Meta发布自我奖励机制,Llama在3轮训练后超越GPT-4 | OpenAI、斯坦福大学提出Meta-Prompting,有效提升语言模型的性能 | OpenAI组建「集体对齐」新团队,确保AI模型与人类价值观保持一致! | 突发!美国将限制中国使用微软 Azure、亚马逊 AWS 训练 AI大模型 | 腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法 | 今日arXiv最热NLP大模型论文:伯克利&DeepMind联合研究,RaLMSpec让检索增强LLM速度提升2-7倍! | 剑指百度!360上线「AI搜索」APP,是挑衅还是防御? | 全新开源AI代码工具诞生!超越谷歌DeepMind旗下AlphaCode | OpenAI:我愿花500万购买新闻文章版权,谷歌:我出10亿美金 | 浙大团队撰写75页科学语言大模型综述,全面梳理Sci-LLMs最新研究进展 | 这个「AI 写真」开源项目火了! GitHub 一周暴涨四千星,Yann LeCun 亲自转发 | 刚刚,ChatGPT再爆安全漏洞!大量私密对话被泄露 | 智源成立5年,高层大变动!黄铁军不再担任院长,张宏江、唐杰、刘江均已离任 | GPT-4级别模型惨遭泄露!引爆AI社区,“欧洲版OpenAI”下场认领 | 今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent | 北大发表 AI Alignment综述:确保AI与人类价值观一致的四个关键设计原则 | 用 ChatGPT与超过 5000 位女士约会,成功找到未婚妻! | 今日arXiv最热NLP大模型论文:IBM研究院提出Genie方法,自动生成高质量数据集 | Meta发布抽象链,大模型工具利用精度+6%,速度+40%! | 今日arXiv最热NLP大模型论文:引入噪声,可提升RAG检索效果超30%?? | 研究表明:论文被大V宣传后,引用次数暴涨2~3倍! | 今日arXiv最热NLP大模型论文:微软提出SliceGPT,删除25%模型参数,性能几乎无损 | 对AI原生应用做“逆向”后,我找到了大多数大模型厂商注定失败的原因 | 今日arXiv最热NLP大模型论文:大语言模型为什么始终会产生幻觉 | 今日arXiv最热NLP大模型论文:无需数据集,大模型可通过强化学习与实体环境高效对齐 | ICLR2024 | AllenAI 开源了关于大模型的所有细节!数据、代码、参数、训练过程,完全复现 | ChatGPT 变懒最新解释!或和系统Prompt太长有关 | 今日arXiv最热NLP大模型论文:基于语言模型模拟的经济学研究 | 大语言模型为什么始终会产生幻觉? | 复旦TravelPlanner让大语言模型挑战旅程规划 | 今日arXiv最热NLP大模型论文:智能谈判Agent综述,一文读懂谈判桌上的人工智能 | 复旦大学最新研究:如何让大模型敢回答“我不知道”? | 我让ChatGPT帮我钓妹子,它一口气撩了5000人 | 今日arXiv最热NLP大模型论文:清华提出LongAlign,打破长上下文对齐瓶颈,数据、训练策略、评估基准一网打尽 | ChatGPT重大升级:能自动记住用户的习惯和喜好,用户有权决定是否共享数据给OpenAI | 提速30倍,清华大学提出使用GPT-4督导评估教学质量 | OpenAI超级视频模型Sora技术报告解读,虚拟世界涌现了 | 今日Arxiv最热大模型论文:大语言模型真的理解上下文了吗?新研究揭示惊人发现 | 天才科学家谢赛宁紧急辟谣!和OpenAI的Sora模型无关 | 今日arXiv最热NLP大模型论文:上海AI Lab联合清华发布十项全能数学大模型InternLM-Math | 斯坦福大学分析3.2万篇大模型HuggingFace文档后指出:现状堪忧! | 中美两大AI巨头火了!一位是Sam Altman,一位是「李一舟」 | 2024「诺奖风向标」斯隆奖出炉:杨笛一、杜少雷、清华校友姜楠、北大校友金驰等入选 | 大语言模型的深度裁剪法 | 今日arXiv最热NLP大模型论文:微软发布:大模型时代的可解释机器学习,现状与挑战 | 突发!AI独角兽「竹间智能」被曝停工停产6个月! | 符尧大佬一作发文,仅改训练数据,就让LLaMa-2上下文长度扩展20倍! | 今日arXiv最热NLP大模型论文:无需提示也能推理!Google DeepMind新研究揭示AI内在推理能力 | 大离谱!AI写作竟让孔子遗体现身巴厘岛,看完笑不活了 | Gemini被曝光歧视白人,Google再次被围攻,马斯克也加入了! | 外星文明会是朋友还是敌人?科学家用AI模拟揭示惊人答案! | 大离谱!AI写作竟让孔子遗体现身巴厘岛,看完笑不活了 | 复旦发布多模态大模型AnyGPT,文图语乐样样行 | Sora完整能力曝光!多模态视频理解或成为下次爆点 | Deepmind最新研究:一个技巧,思维链不再需要提示词激发了! | 复旦发布ToolSword框架,揭露大模型工具学习中的安全风险 | 突发!苹果放弃十年造车梦!转身押注AI,2000人团队解散或转岗、数十亿美元打水漂 | 突发!苹果放弃十年造车梦!转身押注AI,2000人团队解散或转岗、数十亿美元打水漂 | 突发!苹果放弃十年造车梦!转身押注AI,2000人团队解散或转岗、数十亿美元打水漂 | 机器遗忘同等重要,AI如何忘记不良数据,保护用户隐私? |

AI论文:
2022年「百强AI论文」出炉:清华紧随谷歌排名第二,宁波工程学院成最大黑马 |

2022

NeurIPS | ICML | IEEE INFOCOM | ICDCS | ACL (CSRR) | KDD (BIOKDD) | TheWebConf | SIGIR | ICDE | ACM SIGMOD | VLDB | IJCAI | ACMM | EMNLP | ISWC | COLING | KR | ECML-PKDD | CIKM | ICME | ICMR | WSDM | ICAPS | AAMAS | ASE | FSE ESEC | ISSTA | ICSME | SANER | ESEM | ISSRE | ICPC | RE | CAiSE | MoDELS | ICWSM | ICWS | ACSAC | Internetware | ICASSP | BIBM (Download) | NAACL | IJCNN | ACML | PAKDD | ECIR | NLPCC | ICONIP | KSEM | ESWC (GeoLD2022) | PRICAI | ICWSM | TASE | SEKE | ACM SIGSPATIAL | LREC | APWeb-WAIM | IEEE BigData (Download) | WISE | WISA | GLOBECOM | APSEC | MSR | REFSQ | QRS | AACL-IJCNLP (Translation) | ICC | INLG | CCL | CCKS | CCIR | ICBK | ADMA | KGC | NLGIW | CHIP | IJCKG | CBC (Report) | ChinaMM | ChinaSoft | ChinaService | ChineseCSCW | AKBC | ICWL | CCBR | CAC | CCF Bigdata | CHIL | ICCRD | ICSS | NDBC | SPATIAL DI | IGARSS |
ICLR 2022图学习领域都在研究什么?Open Review投稿文章一览 | ICLR 2022 审稿结果统计速览 | 元学习热度不再!ICLR 2022投稿趋势:强化学习榜首,深度学习第二 | 快讯|北邮GAMMA LAB的三篇工作被NeurIPS 2022 接收 | Paper Digest: ICML 2022 Highlights (report) | ACL2022赶会必备,拿来即用之Abstract和Related Work | NLP的“第四范式”之Prompt Learning总结:44篇论文逐一梳理 | ICLR 2022 评审出炉!来看看得分最高8均分的31篇论文是什么! | NIPS 2021所有论文及review | NIPS 2022所有论文分数排名 | 最新10余篇图神经网络&知识图谱的综述 | 从 ACL’22 投稿情况,速览当下 NLP 研究热点! | 中科院自动化所19篇AAAI 2022论文速览!从CV\NLP到机器学习 | 从顶会论文看多模态预训练研究进展 | KDD 2021数据挖掘领域顶会回顾 | AAAI 2019/2020/2021, IJCAI 2019/2020/2021最新更新开源代码集合整理 | 2021图机器学习有哪些新突破?麦吉尔大学博士后一文梳理展望领域趋势 | 2021->2022必看的十篇「深度学习领域综述」论文 | 审稿太奇葩?AAAI 2022接收论文列表放出!特别赛道论文华人参与占46% | CVPR 二十年,影响力最大的 10 篇论文! | AAAI 2022有哪些值得读的NLP相关论文? | ACL 2022录用结果出炉:国内多支团队晒“战绩”,清华一实验组18篇入选 | 新闻 | KEG 9篇论文被ACL 2022录用 | ACL 2022论文盘点出炉!NLP好文一口气读完 | 7 Papers | AAAI22杰出论文、WSDM22最佳论文;200+文献ViT综述 | WWW2022推荐系统/计算广告论文集锦 | AAAI2022奖项出炉!中科院自动化所获Distinguished论文奖,巴黎第九大等获杰出论文 | 最新!WSDM2022最佳论文出炉!清华、人大等机构学者斩获 | 2442 个专业术语!人工智能术语库 AITD 更新至 3.1 版 | 【AI for Science】深度学习对自然科学的影响 | 一文看尽 CVPR2022 最新 22 篇论文(附打包下载) | 100+篇「CVPR2022」最新论文抢先看!论文解读、代码、数据集等,看计算机视觉2022在研究什么? | 本季「必追」!16个社区热议工作及10篇国际AI顶会Best Papers一文回顾 | 重庆邮电大学校长高新波教授:人工智能未来发展趋势分析 | 中科院自动化所17篇CVPR 2022 论文新作速览! | 2022图神经网络5篇最新的研究综述:双曲/图分类/联邦/等变/异质性 | 百篇论文分类整理看数据增广最新研究进展 | 7篇最新【Nature. Mach. Intell. 】图神经网络论文汇集 | 计算机视觉顶尖期刊和会议的段子 | ACL2022奇葩标题大赏 | ACL 2022 主会长文论文分类整理 | 从ACL 2022 Onsite经历看NLP热点 | 最新 NLP Prompt 代表工作梳理!ACL 2022 Prompt 方向论文解析 | 7篇论文梳理关系抽取的经典范式 | 1987-2020最具影响力的 NIPS 论文!!! | 结合NAACL2022经历看NLP研究热点 | KDD 2022 | 美团技术团队精选论文解读 | 忆海原识发布类脑计算平台,下一代AI突破口到来! | 172篇 | COLING 2022论文集 | Hinton努力推翻自己积累了30年的学术成果,我才知道什么叫生命力! |

AI Big Model:
AI 大模型最新突破:帮科学家读论文,小菜一碟 | 大模型“研究源”告急:研究预测,2026年高质量语言数据将耗尽 |

Knowledge Graphs:
先锋洞见 | 陈华钧:从六大趋势看知识图谱的进阶发展 |

Deep Learning:
今年的海德堡论坛,Raj Reddy、Sanjeev Arora、LeCun 与 Bengio 都讲了些什么? |

Databases:
7 Papers & Radios | 国产数据库入选顶会VLDB 2022;一句话生成高清360度场景和光照 |

白皮书:
Bengio、LeCun 等人联名发布 NeuroAI 白皮书:智能的本质是感觉运动能力,AI 迎来具身图灵测试大挑战 |

2021

NeurIPS | ICML | KDD | AAAI | SIGIR | ICDE | ACM SIGMOD | VLDB | IJCAI | ICLR | UAI | IEEE INFOCOM | AAMAS | ICSE | FSE ESEC | EMNLP | ISWC (Accepted papers) | KR | OM | ECML-PKDD | CIKM | ICME | ICMR | DASFAA [Part I][Part II][Part III] | ICSME | SANER | ESEM | ISSRE | ICPC | Internetware | ICASSP | BIBM (Download) | ACML | PAKDD [Part I][Part II][Part III] | ECIR | NLPCC | EACL | NAACL (Conference Program) | KSEM | ESWC (GeoLD2021) | ICONIP | GLOBECOM | ICC | APWeb-WAIM | IEEE BigData (Download) | WISE | APSEC | REFSQ | QRS | ICWE | ACM SIGSPATIAL | INLG | CCL (Report, Download) | ACM RecSys | AKBC (submissions, workshops (including CSKB) in AKBC) | CCKS | CCIR | ICBK | CHIP | ICWSM | IJCLR | ASONAM | WISA | ADMA | IJCKG | CBC (Report) | NCSC | ChinaService | ChinaMM | MLA (bili) | Doctoral Consortium |
Publications in The Web Conference 2021 | WWW2021 | 图机器学习论文一览 | 2022年,图机器学习Graph ML发展到哪了? | SIGIR 2021 | 推荐系统相关论文分类整理 | ACL 2021 long paper list for Knowledge Graph | Paper Digest: ICML 2021 Highlights (report) | KDD2021 | 工业界搜推广nlp论文整理 | 一文速览 | ACL 2021 最全论文分类(主会+Findings) | ACL 2021 主会571篇长文分类汇总 | ACL2021 | 信息抽取相关论文 | ACL2021 知识图谱、推荐系统相关论文 | KDD2021 |时序图/动态图/时序图谱/时空图相关论文一览 | Paper Digest: KDD 2021 Highlights (report) | ACL2021奇葩标题大赏 | NLP领域国际顶会ACL 2021收录结果公布 百度14篇论文上榜 | ACL 2021 | 今年NLP的这些论文,你不能错过! | ACL 2021 | 预训练模型的改进与应用 | 腾讯50余篇论文入选NLP顶会ACL 腾讯AI Lab解读两项NLP成果 | 从ACL 2021中看NLP在医疗领域应用的发展,附资源下载 | KDD2021 |时序图/动态图/时序图谱/时空图相关论文一览 | THUIR师生论文获CIKM2021录用 | CIKM 2021 | 推荐系统相关论文分类整理 | 快讯|北邮GAMMA Lab的四篇工作被CIKM 2021接收 | IJCAI 2021 | 一文了解微软亚洲研究院机器学习方向前沿进展 | “知识图谱”七连击,来自阿里、百度、腾讯、丁香园等热门应用都在这里 | 哈工大SCIR 6篇主会/2篇Findings/1篇Demo 共9篇长文被EMNLP 2021录用 | 18篇近期值得关注的Transformer工作 | 今日arXiv精选 | 14篇EMNLP 2021最新论文 | 今日arXiv精选 | 12篇EMNLP 2021最新论文 | 今日arXiv精选 | 15篇EMNLP 2021最新论文 | 今日arXiv精选 | 31篇EMNLP 2021最新论文 | 刷完EMNLP 2021论文列表,我们挑出了这8篇预训练相关必读论文 | 今日arXiv精选 | 28篇EMNLP 2021最新论文 | EMNLP 2021中预训练模型最新研究进展 | 知识图谱领域有哪些最新研究进展?不妨从EMNLP 2021录用论文寻找答案 | EMNLP/CIKM2021-三篇图神经网络在知识图谱、文本分类上相关论文 | Recsys2021 | 推荐系统论文整理和导读 | 2021年深度学习哪些方向比较新颖,处于上升期或者朝阳阶段,比较有研究潜力? | 【论文导读】2021年论文导读第二十一期,7篇「视觉语言表示、图嵌入」TIP等论文 | WWW2021 | 知识图谱、推荐系统论文集锦 | 谷歌大牛Jeff Dean单一作者撰文:深度学习研究的黄金十年 |

2020

ACL | AAAI | IJCAI | KDD | The Web Conference | SIGIR | ICDE | UAI | IEEE INFOCOM | ICSE | ASE | FSE ESEC | ISSTA | ISWC [Part I][Part II][Posters, Demos, and Industry Tracks] | KR (Download) | OM | EMNLP | ECML-PKDD | ICME | ICMR | ECAI | COLING | WSDM | DASFAA [Part I][Part II][Part III][Workshops] | ECCV | AAMAS | ICSME | SANER | ISSRE | ICPC | MoDELS | BIBM (Download) | NLPCC | ICONIP | KSEM | CoNLL | GLOBECOM | AACL-IJCNLP | LREC | IEEE BigData (Download) | CCL | WISE | INLG | CCIR | AKBC | ASONAM | ACM SIGSPATIAL (Download) |

Highlighted 8 Tutorials in ACL 2020 | Best Paper Awards at ACL 2020 (report in Acadamic Toutiao) | ICML 2020 (report in Zhuanzhi) | Best Paper Awards at SIGIR 2020 (report in BAAI) | Paper Digest: ICML 2020 Highlights | Paper Digest: NIPS 2020 Highlights | Paper Digest: EMNLP 2020 Highlights (report) | Paper Digest: ECCV 2020 Highlights | 一份值得收藏的ACL 2020参会笔记:重要论文与NLP领域的发展趋势解读 | ACL 2020信息抽取方向论文打卡列表(附论文下载) | 图灵奖得主、AAAI候任主席展望“AI未来10年” | 一问一答:ECCV过去五年知多少 | ICML 2020上图神经网络好文 | ICML20 workshop | 感知与推理的桥梁: 超越图神经网络 | KDD 2020大奖出炉! | KDD 2020最佳论文奖出炉!谷歌北航获奖 | ECCV 2020 五项大奖出炉!普林斯顿邓嘉获最佳论文奖| 100 Must-Read NLP Papers (NLP必读经典文献100篇)

2019

ACL | NAACL | ICML | ICLR | SIGIR | ICDE | KDD | CHI | The Web Conference | AAAI | IJCAI | UAI | ICSE | IEEE INFOCOM | ICSE | ASE | FSE ESEC | SANER | ESEM | ISSRE | EMNLP-IJCNLP | ISWC | OM | ESWC | ECML-PKDD | CIKM | ICDM | WSDM | SDM | DASFAA | ICMR | ICSME | ICPC | Internetware | BIBM | IJCNN | PAKDD | ECIR | NLPCC | ICONIP | KSEM | APWeb-WAIM | INLG | WISE | ICC | CCKS | ICBK | AKBC | ASONAM | ACM SIGSPATIAL |

Code for ACL 2019/2020 & NAACL 2019 & EMNLP 2019

2018

ACL | NAACL | ICML | ICLR | SIGIR | ICDE | KDD | CHI | The Web Conference | AAAI | IJCAI-ECAI | UAI | ICSE | EMNLP | ISWC | KR (Download) | ECML-PKDD | IJCNN | PAKDD | ECIR | WISE | ICBK |

How to Doing the Ph.D.
Roadmap to becoming a data engineer in 2020
Research as a Lifestyle!
The fifth Representative Acdemic Websites for Your Research


Pytorch


实操教程|PyTorch自定义CUDA算子教程与运行时间分析 | pytorch从原理到代码的多卡教程 | 图神经网络框架-PyTorch Geometric(PyG)的使用及踩坑 | 终结1.x时代,PyTorch 2.0来了!100%向后兼容,一行代码将训练提速76% | 一行代码,炼丹2倍速!PyTorch 2.0惊喜问世,LeCun激情转发 |


Deep设备选型


科普帖:深度学习中GPU和显存分析 | 个人深度学习工作站配置指南 | CPU和GPU,谁才是小学生? | GPU多卡并行训练总结(以pytorch为例) | 拿什么拯救我的 4G 显卡: PyTorch 节省显存的策略总结 | 当代研究生应当掌握的5种Pytorch并行训练方法(单机多卡) | 深度学习GPU选购指南:哪款显卡配得上我的炼丹炉? |


NLP模型


NLP预训练中的mask方式总结 |


Deep model调参与优化


RTX 3090的深度学习环境配置指南:Pytorch、TensorFlow、Keras | 深度学习模型参数量/计算量和推理速度计算 | FAIR研究员:重新思考BatchNorm中的"Batch" | Batch/Layer normalization有什么区别? | PyTorch 51.BatchNorm和Dropout层的不协调现象 | Google Cloud-如何避免ML中一些坑 | Batch Size对神经网络训练的影响 | 高效 PyTorch: 如何消除训练瓶颈 | CNN调优总结 | PyTorch多卡分布式训练:DistributedDataParallel (DDP) 简要分析 | 综述:PyTorch显存机制分析 | Pytorch显存分配机制与显存占用分析方法 | 实践教程|PyTorch训练加速技巧 | Pytorch Lightning 完全攻略 | 终于可用可组合函数转换库!PyTorch 1.11发布,弥补JAX短板,支持Python 3.10 | 扔掉老破V100、A100,英伟达新一代计算卡H100来了! | Transformer性能优化:运算和显存 | 深度学习『 调参 』技巧合集 | 深度神经网络模型训练中的 tricks(原理与代码汇总) | PyTorch常用代码段合集 | Pytorch - 弹性训练原理分析 | 一文浅谈Transforme性能优化的常见方法 | S级秘术!指导ChatGPT训练一个神经网络的超详细「指令」来啦! | 惊呼!在Mac上可以跑LLaMA啦!附上详细教程 | 3090单卡5小时,每个人都能训练专属ChatGPT,港科大开源LMFlow | 大模型微调方法总结 | 降龙十八掌:这套优化transformer内存占用的组合技值得收藏 |


配置管理


Pycharm常用快捷键大全 | 10秒!GitHub工程团队转移到Codespaces,开发环境「即开即用」 | Pycharm那些隐藏的实用小技巧,yyds! | 始于 Jupyter Notebooks:一份全面的初学者实用指南 | Jupyter Notebook 的那些高效率操作 | JupyterLab 3.0,极其强大的下一代 notebook! | Web版VS Code上线:最好用的IDE终于发布网页版,然而微软发完秒删 | 薅羊毛 Colab使用外部数据的7种方法! | 【Python】Python环境配置保姆教程(Anaconda、Jupyter、GPU环境)! | Debug无忧!清华校友打造编程神器:反向追踪变量、数据流等 | 60 个神级 VS Code 插件! | 太赞了!Python 开发神器Jupyter竟然还有可视化debug功能! | 这篇罕见的符号编程论文,让你在Jupyter Notebook中手绘草图并变成代码 | 谷歌大动作!TPU超算系统大升级,全面超越英伟达A100 | 免费送GPU算力,轻松跑模型!趋动云GPU平台推荐 | Jupyter大升级,可与大模型交互,已开源 |


Interesting Research Directions





生物计算


​首届中国生物计算大会在苏开幕,百图生科发布免疫图谱卓越计划 | 清华、北大、中科院六位专家同台论道:生物智能的本质与下一代类脑AI |


Knowledge-Enhanced Systems


贝叶斯网络之父Judea Pearl推荐:迈向可解释的知识驱动系统


Code Understanding and Computation


是成就还是削弱?AI代码生成工具与程序员的「相爱相杀」


AI Trend


AI改变世界:一口气看完人工智能发展史 | SIGIR|乘风破浪的AI华人学者们 | 14万学者数据揭秘:上海顶尖AI人才31年流动态势 | 万维网之父对当前互联网表现不买账,本可以做得更好 | 科学成果≠商业成功:创业的科学家们还需关注这4件事 | 国家五部委联合发布“AI标准顶层设计”:2021年明确、2023年初步建成 (附建设指南) | 不止一年拿下青千、杰青、长江学者,这位教授回答清华学子AI两千问也是一流 | 一份来自贾扬清的AI青年修炼指南:不存在算法工程师、调参侠没有市场 | 2020国内本科开设人工智能专业高校,都在这了 | 张钹院士:第三代人工智能的特点、发展现状及未来趋势 | 清华张钹、北大朱松纯、南大周志华,他们都是…… | 英美签署新协议,在人工智能领域展开合作,进一步对抗中国 | 剑桥大学2020《AI全景报告》出炉 | 清华张钹院士专刊文章:迈向第三代人工智能(全文收录) | 专访吴军:未来10年,AI的发展方向是应用,不会出现重大的理论突破 | 美国家人工智能安全委员会发布80项人工智能建议 | 韩辉:国产操作系统的最大难题在于解决“生产关系” | 人工智能工程化、超级自动化...Gartner发布2021年重要战略科技趋势 | 2021年人工智能的四大趋势 | 白宫即将出台人工智能新规,“轻触式”监管、保持美国在AI领域的领导地位 | 硅谷教父John Hennessy:我们正站在计算机架构第五时代的门槛上 | 预测:2021年,人工智能将大放异彩 | AI助力顶尖人才竞争:全球首款基于知识图谱的智能人才服务产品发布 | 张亚勤:智能产业新浪潮下的我们 | 清华大学施路平:双脑驱动的人工通用智能 | 回顾理查德·费曼1985年对通用人工智能的思考 | AI改变世界:一口气看完人工智能发展史 | 重磅!全球人工智能最具创新力城市榜单发布,中国32个城市进入世界500强 | 八位AI学者论道:下一代机器学习的应走之路 | 中国人民大学赵鑫:AI 科研入坑指南 | 【独家解读】Nature论文AlphaFold:AI推动科学发现 | 史无前例的2020!《自然》十大科学人物出炉:李兰娟、张永振、谭德塞、福奇等人上榜 | 陈左宁院士:人工智能模型和算法的七大发展趋势 | 李飞飞、Judea Pearl等16位顶级科学家参与,一场推动AI前进的大辩论,2020 AI DEBATE 来了 | Nature:2021年最值得关注的科学事件 | 2020年度智谱·AI人工智能技术发展报告集(AI TR)(敬请收藏) | 阿里达摩院发布2021十大科技趋势 | 1694件AI事件大盘点!2020年最后一个月,哪些事让你记忆深刻?| 智谱·AI发展月报 | 智源研究院发布2020年世界十大 AI 进展 | 智能革命的开始!AI下一个十年,将变革人类医疗和艺术 | 上海公布《关于全面推进上海城市数字化转型的意见》 | 重磅丨中国工程院发布 “中国电子信息工程科技发展十四大趋势(2021)” | 阿里巴巴人工智能实验室“黄”了 | 自然指数2020出炉:从机构合作网络看美加中日欧的AI研究差异 | Jeff Dean万字长文:2020谷歌10大领域AI技术发展 | 美国国防科研情报追踪系统发布,200余所最具国防科研实力的美高校尽收眼底! | 495篇新闻187个事件全景分析 | 智谱·AI人工智能发展月报(2021年1月) | 一句话总结英国新规:不欢迎AI专业的中国留学生、学者与研究员 | 2020学术会议回顾:从这些最佳论文中一窥研究趋势 | 2020年AI顶会最全数据重磅出炉!看看我们挖出了什么宝藏 | Nature评选改变科学的10个计算机代码,arXiv、AlexNet等上榜 | 2021 年将是“人工智能硬件年” | 《麻省理工科技评论》2021 年 “十大突破性技术” 发布会在杭州余杭未来科技城圆满举办! | 先锋洞见 | 恒生研究院白硕:数据智能革命 | MIT学者万字长文:计算机作为一种通用技术的衰落 | 《2021科技趋势报告》重磅发布 | 专访唐杰 | 我国首个超大智能模型「悟道」发布,迎接基于模型的AI云时代 | 下一代人工智能 | 美国未就AI竞争做好准备;数学界“诺奖”揭晓;全球AI专利TOP10中国企业仅占两席|智谱・AI人工智能发展月报 | 2021年人工智能全球最具影响力学者榜单AI 2000发布[报告] && 2021全球最具影响力 AI 学者榜单: 中国占比11.1%,位列第二 | 麻省理工牛人解说数学体系 | 时隔16年,Science再次发布“全世界最前沿的125个科学问题”! | 工程院院士李德毅:认知的三次革命,类脑的五条启发 | 中国工程院院士李德毅:新一代人工智能如何从传统人工智能中脱颖而出 | 2020年人工智能领域突破性工作 | 蔡自兴院士:开源开放是人工智能发展新趋势 | Michael Jordan:人工智能研究的目标变了,不再是构建单个智能 | 2021机器学习研究风向是啥?MLP→CNN→Transformer→MLP! | 无监督学习、多模态融合!腾讯、厦大联合发布2021十大人工智能趋势 | 李开复:AI技术驱动的二十年五大预测 | 有认知会推理!视觉大模型的未来不只靠表征 | 深度学习的未来!Hinton,Lecun和Bengio三巨头联手再发万字长文 | 陶大程:判断人工智能是否可信的“四把尺子” | 深度学习三巨头共同发文,聊聊深度学习的过去、现在与未来 | NTT高级科学家:光子是深度学习的未来!光子有望替代电子计算机加速神经网络计算 | 清华大学张钹:实现下一代人工智能的两个范式 | NLP≠NLU,机器学习无法理解人类语言 | PNAS论文:近30年来,人类社会的认知扭曲现象激增 | 从技术到科学,中国AI向何处去? | 向量将死,哈希是AI未来 | 我国智能建造关键领域技术发展的战略思考丨中国工程科学 | ACM与IEEE双Fellow、华人女计算机科学家周以真:可信 AI,未来可期 | 新一代人工智能:从“感知智能”向“认知智能”转化 | 西电焦李成院士:从脑科学和认知科学到人工智能,我们能够从生物物理机理中得到什么启发? | 算力≠智慧! MIT教授抛出「意识来源」新理论:人类认知与计算根本没关系 | IBM Watson「败走中国」内幕:认知推理远未成熟,却言必AI | Google Jeff Dean | Pathways:下一代人工智能架构 | 比利时皇家科学院院士Luc De Raedt:从统计关系人工智能到神经符号计算 | 深度梳理这10个国家的AI发展战略 | 浙大求是特聘教授吴飞:数据驱动与知识引导相互结合的智能计算 | 温故而知新,6位顶级CV科学家聚首:计算机视觉中的深度学习方法vs传统方法 | 2021研究前沿热度指数 | 2021研究前沿 | 2020 年人工智能几个重点领域,顶级国际学术会议分析报告 | 徐宗本院士:人工智能的10个重大数理基础问题 [报告] | 姚期智院士:数据、算法、算力为何是数字经济核心技术? | 搞深度学习框架的那帮人,不是疯子,就是骗子 | 2022 达摩院十大科技趋势 | 新一代AI人才从哪里来,该往哪里去?| GAIR 2021院长论坛 | P vs. NP 五十年:AI正在解决不可解问题 | 芯片设计的超高门槛,正在被AI「粉碎」 | 周志华,唐杰教授等专家,站在 2022,展望大模型的未来 | AI for Science时代,知识何存? | “Web3之父”回答:Web3究竟是什么? | Jeff Dean长文展望:2021年之后,机器学习领域的五大潜力趋势 | Web 3.0生态全解析:颠覆性的技术变革 | 姚前:Web3.0,渐行渐近的新一代互联网 | Web 3.0世界中的嬉皮士、先知与造物主 | Web3.0前瞻研究报告(2022年) | Web3与社交网络的未来 | 万字研讨实录(下) | 当思想与机器融合:脑机接口与人类的现在、困境与未来 | 医学影像AI新晋IEEE Fellow「大论道」:后深度学习时代的记录、风向与产学思考 | 年度回顾 | 2021年人工智能领域值得回味的资本事件 | 2021年量子计算的研发现状与未来展望 | AMiner发布:2022年人工智能全球最具影响力学者榜单AI 2000 | 一年一总结的NLP年度进展,2021年有哪些研究热点? | 百度研究院发布2022年十大科技趋势!以AI为灯、为桨,扬帆起航! | 图灵奖得主Yann LeCun最新访谈:人工智能面临的三大挑战 | 2022年你应该知道的五大机器学习算法,解释型算法、降维算法榜上有名 | 万字长文!DeepMind科学家总结2021年的15个高能研究 | 《中国金融》|姚前:Web3.0:渐行渐近的新一代互联网 | 创新工场首席科学家周明博士:认知智能的进展和思考 | 谷歌下一代AI架构、Jeff Dean宣传大半年的Pathways终于有论文了 | 2022年计算机视觉领域五大发展趋势 | 2022年,值得关注的8大人工智能趋势 | 2022技术趋势(中文版) | 深度学习“开挂”十年,谷歌AI大牛Jeff Dean发文剖析并提出未来发展方向 | 梅宏院士:如何构造人工群体智能 | 周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”! | 深度知识的6个维度:如何让人工智能真正理解世界? | 数据库横向对比与前沿技术分析探讨 | Geoff Hinton最新访谈视频:谈人工智能革命…再一次 | Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑的运作机制,但不是通过反向传播 | 为什么Web3.0革命必将发生在中国? | 李德毅院士 | 人工智能基础问题:机器能思维吗? | LeCun用62页论文公布未来十年研究计划:AI自主智能


AI in Universities


厦大AI研究院今日揭牌成立:数学系校友陈纯院士领衔,最亮眼的是「交叉」研究思路 | 北京人工智能研究院成立 | 对话南科大沈平:在人工智能开源中,高校能扮演什么角色? | 345 所开设人工智能本科专业高校名单大全 | AI专业报考指南:开设高校、就业前景、未来薪酬、报考误区 | 工业界和学术界最大区别是什么? | 刚刚,北大智能学院成立!AI视觉泰斗朱松纯教授任院长 | 清华大学计算机系成立量子软件研究中心,应明生受聘为主任


AI监管


2022年第一波AI重磅监管:官方发布“算法推荐管理规定” | 国家互联网信息办公室关于《互联网信息服务算法推荐管理规定(征求意见稿)》公开征求意见的通知


Research Groups


MSRA Natural Language Computing (NLC) Group | CUHK Text Mining Group | HKUST Human Language Technology Center | Social Media Mining Group | NLP2CT | NLP Lab, National Taiwan University | NLP Lab, Tsinghua University | Knowledge Engineering Lab, Tsinghua University | Knowledge Intelligence Research Center | Beijing Academy of Artificial Intelligence | Information Retrieval Group, Tsinghua University | CoAI | KLCL, Peking University | LCWM group, Peking University | Data Management Lab, PUCRI | The Knowledge Computing Lab, The National Engineering Research Center for Software Engineering | Dlib Group | Intelligent Computing and Sensing Laboratory, ICSL | Knowledge Works Research Labortory, Fudan University | Fudan Natural Language Processing Group | HIT-SCIR | HISZ-HLT Group | Intelligence Technology & NLP Lab | Machine Intelligence and Translation Lab | Knowledge Graph Research Group, Northeastern University | NLP Group, Nanjing University | Learning And Mining from DatA (LAMDA), Nanjing University | NLP Lab, Xiamen University | DUTIR | NLP Lab, Soochow University | NLP Group, Heilongjiang University | TAM Lab, South China Normal University | StatNLP | NUS NLP Group | AI2 Allen Institute for AI

国内外优秀的计算机视觉团队汇总 2020.07 updated | 国内有哪些自然语言处理的牛人或团队?
顶尖的工业界NLP团队(主要有:达摩院NLP团队) | 新加坡有哪些大学实验室关注 NLP 和 IR 研究方向? | 国内较强的NLP高校实验室有哪些? | 国内外知识图谱相关公司浅析 | 选人工智能最强导师?建议你收藏这份名单 | 知乎热议!2021大厂AI Lab现状盘点,网友:名存实亡 | 从Google Scholar看各大科技公司科研水平
打造中国版ChatGPT,这是国内最有实力的一批NLP团队与人才


People & Blogs


Haixun Wang | Zhongyuan Wang | William Cheung | Maosong Sun | Zhiyuan Liu | Yang Liu | Shaoping Ma | Min Zhang | Yiqun Liu | Xiaoyan Zhu | Minlie Huang | Juanzi Li | Jie Tang | Bin Xu | Wenwu Zhu | Jianyong Wang | Xiaojun Wan | Bin Cui | Dongyan Zhao | Lei Zou | Ming Zhang | Weiwei Sun | Yu Sun | Zhifang Sui | Rui Yan | Wei Hu | Jun Zhao | Le Sun | Xianpei Han | Shizhu He | Kang Liu | Jiajun Zhang | Yanyan Lan | Zhichun Wang | Chuan Shi | Xin Wang | Haofen Wang | Xiaowang Zhang | Meishan Zhang | Xuanjing Huang | Xipeng Qiu | Yanghua Xiao | Zhixu Li | Weiguo Zheng | Huajun Chen | Ting Liu | Bing Qin | Wanxiang Che | Ming Liu | Tiejun Zhao | Ruifeng Xu | Hai Zhao | Jiajun Chen | Xinyu Dai | Wei Hu | Gong Cheng | Jie Shao | Yue Zhang | Min Yang | Xiaofang Zhou | Wenliang Chen | Kewei Tu | Xindong Wu | Guilin Qi | Jun Liu | Tong Ruan | Ru Li | Yi Chang | Yangqiu Song | Wenjie Li | Kaizhu Huang | Wei Lu | Wei Wang | Xiaodan Zhu| Lina Yao | Wenjie Zhang | Xiang Ren | Gerard de Melo | Soroush Vosoughi | Heng Ji | Jiawei Han | Jeff Z Pan |

【Younger Scientists】
NLP/KG Field:
Fangzhao Wu | Duyu Tang | Meng Jiang | Haoyue Shi | Diyi Yang | Muhao Chen | Pengfei Liu | Ziyu Zhao | Chenguang Wang | Irene Li | Chuxu Zhang | Xin (Eric) Wang | Dixia Li | Xinya Du | Yao Ma | Yongfeng Zhang | Hongwei Wang | Yu Meng | Xiaotao Gu | Kai Shu | Jingjing Xu | Fei Liu | Jiaoyan Chen | Weiren Yu | Bang Liu | Xiaodan Zhu | Lingyang Chu | Arijit | Jie Wang | Tong Xu | Yuchen Lin | Shirui Pan | Min Xu | Yuanfang Li | Wen Hua | Shirui Pan | Siqiang Luo | Tao Yu | Qi Liu | Bowen Zhou | Xianling Mao | Zequn Sun | Xiaolong Jin | Ruqing Zhang | Yanan Cao | Yubo Chen (En) (Cn) | Ziyu Lyu | Hao Wang | Jing Zhang | Xiao Wang | Cheng Yang | Guanglin Niu | Ningyu Zhang | Shumin Deng | Yang Yang | Jie Yang | Junchi Yan | Jiangjie Chen | Jiarong Xu | Bo Xu | Meng Wang | Tianxing Wu | Qiang Gao | Yu Zhao | Lifu Huang | Yuxuan Wang | Carl Yang | Sheng Zhang | Sendong Zhao | Jing Li | Feiliang Ren | Yixin Cao | Jiliang Tang | Jingsong Su | Yoon Kim | Mike Shou | Lidong Bing | Yun Chen | Peng Peng | Huanyong Liu |

Temporal KG Representation Learning Field:
Luyi Bai | Jing Yang | Chengjin Xu | Zifeng Ding |

GNN Field:
Wanyu Lin |

NLP Field:
Guanhua Chen |

Dependency Analytics Field:
Yong Jiang |

Neural Language Field:
Hongwen Cao |

Language Model Field:
Junxian He |

Commonsense Knowledge Field:
Tianqing Fang |

AI/NLP in Education Field:
Guanliang Chen |

Trustworthy AI/ML Field:
Haohan Wang |

Interpretability DL/AI Field:
Bhargavi Paranjape |

KG in the Agriculture Field:
Zaiwen Feng | Zaiwen Gengjie (Jay) Jia |

KG in the Energy Field:
Yuntian Chen [Recruitment Info] | Fengji Luo | Luu Anh Tuan |

Computational Linguistics Field:
Guanyi Chen |

Language + Vision Field:
Liwei Wang | Xili Dai |

Information Theoretic Field:
Teng-Hui Huang |

Human-computer Interaction Field:
Yuanchun Shi |

Brain Computer Interfaces (BCI) Field:
CT Lin |

Data Mining Field:
Jieming Shi | Xiang Zhang | Lei Bai | Shudong Huang | Lei Zhang |

Machine Learning Field:
Chang Xu | Fanny Yang | Hongteng Xu | Zhao Kang |

Database Field:
Xiaokui Xiao | Yixiang Fang | Siqiang Luo | Sibo Wang | Jing Tang | Ronghua Li |

Recommender System Field:
Xiangyu Zhao | Shoujin Wang | Junyang Chen |

Spatial-Temporal Data Mining Field:
Leye Wang | Ruiyuan Li | Hao Liu | Wenwen Li | Chao Huang |

Geographic Information Systems Field:
Jingbo Zhou | Hongzhi Yin | Yong Li | Chen Gao | Xiangnan He | Zhipeng Gui [Luojia-spatial Lab] | Bolong Zheng | Tong Zhang | Xueying Zhang | Zekun Li | Yiliang Wan |

Medical Image Analysis
Xiaomeng Li |

Internet-of-Things Field:
Edith C.H. Ngai |

Complex Networks Field:
Xiaolong Ren |

Visual Analytics Field:
Huamin Qu [VisLab] | Zhihua Jin | Liwenhan Xie | Xinhuan Shu | Wei Chen | Xiaoru Yuan | Nan Cao [iDVX_Eng] [iDVX_CN] | Yuyu Luo | Zhiguang Zhou |

3D Vision System Field:
He Wang | Shanxin Yuan |

Distributional System Field:
Hao Wang [IntelliSys Lab] | Yang You [HPC-AI] | Shuhao Zhang | James Cheng | Shi Pu | Lin Tao [LINs Lab] | Zhi Yang |

Software Engineering Field:
Xin Xia | Hui Liu | Ming Li | Junjie Chen | Lili Wei | Yulei Sui | Zhenchang Xing | Xiaoning Du | Yueming Wu | Tao Zhang | Cuiyun Gao | Jiasi Shen | Tao Xie | Xin Peng [CodeWisdom] | Pinjia He | Max Yu Pei | Yepang Liu | Min Zhang | Ge Li | Hongyu Zhang |

Service Computation Field:
Yingjie Wang |

Speech and Music Intelligence Field:
Wei Xue |

Neuroscience Field:
Xun Yang | Huajin Tang |

Spiking Neural Networks Field:
TAN Kay Chen | Jibin Wu |

Biochemistry Field:
Boxiang Liu [Genomic Data Science Group] | Jie Fu [Recruitment info] | Mingwei Min [Min Lab] | Hao Chen [Recruitment info] | Jie Yang [YLab] | Tianfan Fu | Yanlin Zhang |

Food Computation Field:
Jaewoo Kang | Mohammed J. Zaki | Sunkyu Kim | Jingjing Chen [Report] | Weiqing Min | Yijun Tian | Diya Li |

Image and Graphics Field:
Ning Xie |

Fluid-Structure Interaction Field:
Dixia Fan [i⁴ - FSI Lab] |

Smart City Field:
Guang Wang |