报告时间:2023年12月1日上午 9:00
报告地点:31#312
报告人:刘刚
报告题目:大语言模型的前世今生
报告内容简介:
本报告首先追溯了自20世纪50年代图灵测试提出后,人类如何不断探索机器语言智能的发展历程。继而,深入解析了大语言模型(LLM)的演变,从早期的统计语言模型,经过神经语言模型的阶段,至今日的预训练语言模型(PLM)。此外,报告强调了在大规模语料库上对Transformer模型进行预训练的必要性,及其在自然语言处理(NLP)任务中所展现的卓越能力。进一步,报告探讨了大语言模型与传统预训练语言模型之间的差异,特别是LLM在涌现能力和人机交互方式上的创新。报告还详细分析了大语言模型对NLP、信息检索、计算机视觉(CV)领域乃至互联网应用的广泛影响,尤其是ChatGPT和GPT系列在推动“通用人工智能”(AGI)时代到来上的重要作用。此外,报告还包括了大语言模型的关键组成部分,如模型规模、涌现能力、模型架构和预训练任务等。同时,还详尽介绍了大语言模型的指令微调、对齐微调和效率微调等技术。通过这些细节,报告全面展示了大语言模型在技术进步和应用前景上的深远意义。
报告人简介:
刘刚,男,博士,副教授,硕士生导师。主要研究方向:人工智能、自然语言处理、计算机视觉、知识图谱、问答系统。1976年9月出生,1999年始任职于哈尔滨工程大学计算机科学与技术学院。2005年美国伊利诺伊大学香槟分校(UIUC)访问学者,2014年澳大利亚莫纳什大学(Monash)访问学者。教育部教育后勤协会信息化建设专家组成员,工业和信息化部教育和考试中心专家,教育部学位与研究生教育发展中心专家。IEEE会员,ACM会员,中国计算机学会高级会员,中国人工智能学会会员,中国中文信息学会会员。长期以来一直在高等院校从事人工智能、大模型、视觉语言预训练模型、医学视觉问答、多模态知识图谱等方面的教学科研工作。承担国家自然科学基金项目1项,国家重点研发计划项目1项,国家科技支撑计划项目2项,教育部规划基金项目1项,国家重点实验室开放基金2项,中国博士后科学基金1项,黑龙江省自然科学基金1项。获得中国信息化成果二等奖1项,黑龙江省科技进步二等奖1项、三等奖2项,授权发明专利8项,软件著作权14项。在国际学术期刊和国际学术会议上发表学术论文60余篇,10余篇被SCI、SSCI检索。出版专著和教材6部。