您的位置:首页 >> 行业研究 >> 文章正文

互联网传媒行业周报周观点:中国电信语音大模型支持30种方言,清华发布YOLOv10

加入日期:2024-6-5 12:37:25

  顶尖财经网(www.58188.com)2024-6-5 12:37:25讯:

(以下内容从上海证券《互联网传媒行业周报-周观点:中国电信语音大模型支持30种方言,清华发布YOLOv10》研报附件原文摘录)
主要观点
5月25日,中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。在2024智算云生态大会上,星辰语音大模型被官宣发布并开源。识别方面,大模型打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,在国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,星辰语音识别大模型斩获了语音识别赛道冠军。同时在NIST(美国国家标准与技术研究院)举办的低资源粤语电话Babel语音识别任务上,取得业内最优结果。场景落地方面,星辰语音大模型已在北京、福建、江西、广西等地万号智能客服系统试点应用。它能秒懂方言然后服务用户,日均处理约200万通电话。智能客服翼声平台也接入了星辰大模型的语音理解和分析能力,实现31省全覆盖,每天处理125万通客服电话。
5月23日,由清华发布YOLOv10论文,升级目标检测系统的YOLO系列。YOLO因为性能强大、消耗算力较少,一直以来都是实时目标检测领域的主要范式。该框架被广泛用于各种实际应用,包括自动驾驶、监控和物流。其高效、准确的物体检测能力使其成为实时识别行人和车辆等任务的理想选择;在物流方面,它有助于库存管理和包裹跟踪,通过AI能力帮助人们在很多工作上提高了效率。YOLOv10的突破在于从后处理和模型架构方面进一步提升了YOLO的性能-效率边界。
与传统互联网企业相比,国产运营商电信优势较为明显,其一方面拥有丰富的网络和算力资源,相对来说训练、推理成本更低。尤其在大模型的建设方面,更容易发挥规模的优势,目前已打造基础模型+行业模型+应用模型的布局,除了自研本身,还采取生态合作的方式,联合头部生态构建了涵盖教育、政务、应急等20多个行业大模型,覆盖全行业500多个应用场景;另一方面拥有庞大的客户群体作为落地基底,以及丰富的2C、2H、2B的信息服务经验,能够更快地推动大模型在各个领域的落地,形成新的经济增长点。在大语言模型百花齐放阶段,我们认为国内大厂持续投入大语言模型,有望打造出更适合中国的AI生产力工具。目前AIGC行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。
投资建议
基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。
AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:
1、AI:关注【昆仑万维】;推荐【创业黑马】。
2、MR:推荐【风语筑】。
3、游戏新模式:建议关注【吉比特】;推荐【完美世界】、【三七互娱】。
4、影视新模式:关注【上海电影】、【中文在线】、【华策影视】、【掌阅科技】、【光线传媒】。
风险提示
政策边际优化的程度不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。





编辑: 来源: