滴滴AI语音团队获国际顶尖智能对话系统竞赛世界第一

发布时间：2026-01-02 15:35:32

近来，在世界顶尖人工智能竞赛第九届对话体系技能挑战赛（DSTC9）中，滴滴语音和NLP技能团队参加端到端多范畴面向使命型对话体系使命荣获世界第一，充沛显示滴滴公司在自然语言对话范畴的立异才能。

对话体系技能挑战赛（DSTC）旨在处理时下最前沿、最具挑战性的对话体系技能问题，在对话范畴具有极高的权威性，迄今已举行九届。本届DSTC9由微软、Google、IBM研究院、Amazon、CMU、清华大学等联合举行，招引了业界和学术界各路顶尖团队纷繁参加。滴滴参加的端到端多范畴面向使命型对话体系（End-to-end Multi-domain Task Completion Dialog）赛道共招引全球60多支团队参赛。

多范畴面向使命型对话体系指经过人机对话旨在协助用户完结实践详细的使命，比如在接连对话中完结订酒店，机票、餐厅等多项使命。此次竞赛所用的MultiWoz揭露数据集共跨七个范畴，每个对话均匀13轮。该竞赛要求体系不只要从人类复杂多变的表达中快速了解目的，还能在多范畴中交叉切换，给予精确适宜的答复，终究完结使命。这也对现有使命型对话体系提出更高要求。

在竞赛中，滴滴运用了HybridDTA模型，选用范畴自适应（Domain Adaptive）以及使命自适应学习（Task Adaptive）混合技能，经过大规模domain数据预练习、使命分阶段多目标学习、范畴自适应去词化预处理和后处理等，让模型可跨范畴学习使命型对话体系的推理进程。

而为了让体系答复愈加智能挨近人类，滴滴模型在端到端GPT2模型基础上参加根据对话范畴的数据预练习，并选用一系列容错后处理纠正机制改善终究成果。终究获得人工评测使命成功率（Average Success Rate）世界第一，相对DSTC8同使命提升了近9个百分点，其间人工评测体系答复适宜分数相较DSTC8提升了3.8%，意味着人机对话的了解力和回复才能在多范畴使命到达新的高度。

现在，这一语音对话体系已在滴滴广泛运用，如智能客服对话、车机体系语音交互、司机端内语音交互等。除积极探索技能前沿，滴滴也继续推动对话交互才能的敞开，除上一年 8月，开源根据深度学习的自然语言渠道DELTA，进一步下降开发者创立、布置自然语言处理体系和语音模型的难度之外，上星期，滴滴还联合天津大学、杜克大学敞开了大规模数据库，供给由超越6000名说话人专门录制的近800小时的语音数据和注音标示。

返回资讯列表

新闻详情

相关推荐