CCF@U1155:CCF自然语言处理专委走进哈尔滨商业大学
CCF走进高校第1155场
敬请关注
由中国计算机学会(CCF)主办,CCF自然语言处理专委、哈尔滨商业大学计算机与信息工程学院、黑龙江省电子商务与信息处理重点实验室承办的CCF走进高校活动,将于2024年11月8日在哈尔滨商业大学召开,敬请关注。
活动时间:2024年11月8日(星期五)8:30-17:00
活动地点:哈尔滨商业大学4号教学楼4314多媒体教室
报告信息:
报告题目1:面向科学智能的大模型能力增强
报告摘要:经过海量数据预训练后的大模型,虽然以参数形式存储了大量的知识,但其训练目标仅为进行下一个词的预测,受生成式框架限制,不可避免产生幻觉现象,影响了生成内容的真实性和可用性。该报告首先从知识的存储和认知两个角度切入,分析大模型知识边界和模型幻觉之间的潜在关联,提出探测大模型知识边界的方法。随后,以垂直领域大模型、数学推理大模型和智能体大模型为例,探讨如何运用思维链、指令微调、强化学习、自我进化等手段,向大模型有效注入领域知识,以拓展其处理海量领域数据、理解用户意图、进行知识推理的能力,从而为科学智能提供强大助力。
报告嘉宾:
黄萱菁,复旦大学特聘教授、国家“万人计划”科技创新领军人才。主要从事人工智能、自然语言处理和信息检索研究。兼任中国计算机学会理事、自然语言处理专委会主任、中国中文信息学会理事、计算语言学学会亚太分会候任主席。近年来承担了多项国家级/省部级科研项目,在国际重要学术刊物和会议发表论文200余篇,被引2万余次,8次入选优秀论文奖。获钱伟长中文信息处理科学技术奖、上海市优秀学术带头人、上海市育才奖、人工智能全球女性学者、福布斯中国科技女性等多项荣誉。
报告题目2:财务审计领域大模型研发实践
报告摘要:本报告介绍了哈尔滨工业大学计算学部语言技术研究中心在财务审计领域大模型研发的进展。本研发工作基于国内外最新开源语言大模型(百川系列),在垂域大模型构建的一系列关键技术上进行了多种组合和创新尝试,取得了成效,满足了用户需求。报告介绍了该模型的系统架构和关键技术,包括工具调用、文本到查询语句转换、检索增强、查询结果重排序等。报告还介绍了领域内的国内外研发现状,就存在问题和未来发展进行了讨论。
报告嘉宾:
赵铁军,哈尔滨工业大学教授、博士生导师,学术兼职为中国中文信息学会常务理事、《中文信息学报》编委。主要研究方向:自然语言处理、人工智能应用。曾经承担多项国家项目,曾任国家重点研发计划项目负责人(2018~ 2021);近5年发表学术论文30余篇、获得发明专利10余项;先后获部级科技进步奖6项,出版专著、译著4部。
报告题目3:自然语言生成评价:问题与挑战
报告摘要:近几年自然语言生成(NLG)技术取得了突破性进展,以GPT系列模型为代表的预训练语言模型具有强大的文本生成能力,然而,对不同模型生成文本的可信赖质量评价仍然极具挑战性。目前的自然语言生成评价方法主要包括自动评价和人工评价两类,本报告将分别剖析两类评价方法面临的若干问题和挑战,同时介绍大模型在文本质量评价方面的潜力和可行性,最后介绍我们针对NLG评价所取得的部分研究进展。
报告嘉宾:
万小军,北京大学王选计算机研究所研究员、博士生导师,人工智能研究院兼聘教授,研究方向为自然语言生成与大模型。现担任中国计算机学会自然语言处理专委会副主任、中国中文信息学会大模型与生成专委会副主任,曾担任EMNLP2019程序主席、NLPCC2024大会主席等。三次荣获国际顶尖学术会议(IJCAI2018/ACL2017/NAACL2024)最佳论文或杰出论文奖,连续四年(2020~2023)入选爱思唯尔(Elsevier) “中国高被引学者”榜单,在国内率先研制推出小明、小南、小柯等多款AI写作机器人并应用于媒体单位。
报告题目4:从多模态到多语言再到自我进化,大模型的增强之路
报告摘要:大模型通过大规模语料的学习展现出惊人的能力,成为现在人工智能领域的主流范式,然而其仍然存在诸多局限。首先,大模型最初为基于文本语料训练得到,然而由于人们获取信息的多样性又添加了语音和视觉模态,然而文本仍然是大模型获取知识的主要来源,需要将其他模态和文本模态进行融合,并能处理流式输入并即时进行响应,才能保证大模型满足人类和世界交互的需求;其次,大模型的训练语料通常在不同语言间不平衡,出现中心语言性能明显优于其他语言的现象,需要在中心语言和非中心语言间进行知识迁移,才能提升大模型在非中心语言上的能力;再次,大模型作为一个概率模型,存在幻觉问题,需要判定幻觉并进行修正,才能保证大模型的可靠性。针对以上三个问题,本报告将介绍我们在实时语音翻译、即时响应多模态大模型、多语言大模型以及大模型幻觉方面相应的探索。
报告嘉宾:
冯洋,中国科学院计算技术研究所研究员、博士生导师、“新百星人才计划”入选者,长期从事自然语言处理方向的研究,在本领域重要期刊和会议发表论文100多篇。担任ARR Permanent Senior Action Editor、Artificial Intelligence等期刊编委以及ACL/EMNLP等国际会议(高级)领域主席。主导研发了百聆大模型和LLaMA-Omni即时交互语音大模型,获得ACL2019最佳长文奖、中国人工智能学会“杰出贡献奖”、CCF自然言处理专委会 “青年新锐奖”、 中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等。
报告题目5:基于结构化预训练模型的商品评论情感分析
报告摘要:商品评论文本情感分析是指分析评论文本中表达的情感倾向,抽取文本中与评论相关的属性词与情感词。目前已有的工作大多基于分类或生成模型从文本中抽取情感元素。但是,相关方法无法有效的获取文本的语义信息以及情感元素之间的关联,且存在时间复杂度过高等问题。为此,我们在本报告中将重点介绍基于结构化预训练模型的情感分析,通过在预训练模型的构建、训练、输出等层面结合情感元素关联的方式,可以实现高效和快速的情感信息抽取。
报告嘉宾:
王中卿,苏州大学计算机科学与技术学院副教授,硕士生导师。主要研究领域为自然语言处理,信息抽取等。在人工智能与自然语言处理顶级会议与期刊上(CCF-A/B)以第一或通讯作者发表论文五十余篇。目前主持与参与国家自然科学基金多项。担任ACL,IJCAI,AAAI,EMNLP,COLING等国际会议的高级程序委员或领域主席。
报告题目6:从人工智能到商务智能
报告摘要:去年大模型风生水起,今年诺奖垂青AI,这波人工智能浪潮的渗透力与影响力,可见一斑。本次演讲,将以“AI & BI”为主题,从剖析AI底层技术逻辑开始,尝试探讨后LLM时代AI发展面临的挑战、可能的进化方向,以及对商业模式和企业运营带来的潜在影响。进而围绕AI商业化落地,结合本领域企业相关案例,探索利用AI技术助力BI商业智能的机会,以及数据资产化政策背景下,数智化商业发展的未来。
报告嘉宾:
于浩,男,工学博士,联想控股股份有限公司副总裁,兼创新发展中心董事总经理,联控前瞻技术研究院院长,中国中文信息学会监事,中国人工智能学会NLU专委会副主任,国家工业信息安全发展研究中心科学技术委员会顾问。哈尔滨工业大学(深圳)特聘教授,东北财经大学MBA兼职导师,中关村100企业家俱乐部理事,北京新曦颠覆性技术创新管理中心理事。
报告题目7:生成式大模型时代的应用探索
报告摘要:人工智能是新一轮科技革命和产业变革的重要驱动力量,随着以大模型为代表的新技术取得突破,其强大能力也带来AI应用的变革,如何发挥AI开创、启发和引领的实际作用将成为重要课题。报告将为与会者介绍大模型时代的人工智能技术,分享百度在人工智能领域的业务布局、最新研究进展、应用落地、技术尝试等内容。
报告嘉宾:
孙珂,2011年博士毕业于哈工大,同年加入百度,现任百度杰出研发架构师。在百度工作期间,先后负责词法分析、对话技术(UNIT)、NLP产业落地等多项AI技术与应用落地,相关技术与平台通过持续创新长期保持了业内领先的效果,并为百度多项重要业务提供日均超千亿次的服务。2020年,应业务发展需要,轮岗加入百度智能云,现任应用产品事业部总架构师,并兼任文心快码、百度GBI产品负责人,负责团队技术工作以及对应产品的建设与商业化工作。此外,孙珂还兼任百度智能云技术委员会联席主席,负责ACG工程师人才培养机制和梯队建设工作。主要研究NLP、知识图谱、大数据、视觉、大模型等AI应用方向,在国际顶会与高影响力期刊EMNLP、CIKM、IJCNLP、ESWA等发表论文10余篇,已授权国内外专利80余个。
嘉宾
黄萱菁,复旦大学教授,CCF自然语言处理专委主任
赵铁军,哈尔滨工业大学教授,CCF自然语言处理专委委员
万小军,北京大学教授,CCF自然语言处理专委副主任
冯 洋,中科院计算所研究员,CCF自然语言处理专委委员
王中卿,苏州大学副教授,CCF自然语言处理专委副秘书长
于 浩,联想控股股份有限公司副总裁
孙 珂,百度杰出研发架构师,智能云技术委员会联席主席
执行主席
郑德权,哈尔滨商业大学计算机与信息工程学院院长,教授,博士生导师,计算机科学与技术学科带头人。现为中国教育发展战略学会教育信息化专业委员会理事、黑龙江省高等教育学会计算机基础教育专业委员会常务理事、黑龙江省计算机学会教育工作委员会执委、省教育网信指委会工作组组长、黑龙江省物联网产业协会智库专家、中国计算机学会高级会员、中国中文信息学会会员。2006年3月获哈尔滨工业大学计算机应用技术方向博士学位,主要研究兴趣包括:人工智能及应用、机器学习、电子商务等,主持国家自然科学基金、国家863计划项目、省自然科学基金项目等10余项;参与国家重点研发计划、国家自然科学基金重点及其他国家级、省部级项目10余项;在国内外重要期刊、会议上发表学术论文近百篇,三检论文70余篇;获国家发明专利10余项、软件著作权5项;获部委级科技进步三等奖2项。
CCF微信公众号,欢迎关注