从破译甲骨文到修复三星堆文物,AI for Science无远弗届
甲骨文是汉字的源头。在目前已经出土的16万片甲骨中,考古学家已经发现大约4500个甲骨字,但其中约3000字都未被释读。
也正因此,破译一个甲骨文,最高可获10万元奖金。2022年底,中国文字博物馆于再度发布了这样一条公告。该馆表示,将长期坚持甲骨文释读优秀成果的征集工作,对于经专家委员会鉴定通过的研究成果,单字最高奖励十万元。
随着科技的不断发展和进步,如何利用好新一代的数字科技,更好地保护、传承、发展中华文化遗产,也已成为一个重要的时代命题。在这方面,腾讯近年来开展了诸多探索。
在2023世界人工智能大会(WORLDARTIFICIAL INTELLIGENCE CONFERENCE,WAIC)上,腾讯可持续社会价值副总裁、SSV数字文化实验室负责人舒展发表了以《智能科技助力焕活中华文化》为主题的演讲。
演讲中,舒展围绕甲骨文、三星堆和北京中轴线等中华文化,分享了腾讯运用数字技术进行的探索与实践。
由于甲骨的自然损坏速度比较快,甲骨文专家学者的数量少,因此不仅需要快速完成数据采集,并通过数字空间实现永久性保存,还需要开发对应的智能工具,帮助提升字形匹配的搜索效率和提供有助于破译甲骨文的相关线索。
图丨甲骨文(来源:资料图)
为了攻克上述亟待解决的难题,腾讯SSV数字文化实验室、腾讯优图实验室、安阳市文物局、中国文字博物馆等多个部门携手合作,将文字检测、摹本生成、字形匹配等多种AI算法,综合应用于甲骨文研究。通过这套模型,甲骨文识别与考释、甲骨论著内容提取等工作效率得以有效提升。与此同时,还建立了覆盖143万字的全球最大甲骨文单字数据库,每个单字均可对应到其在拓片中的位置。
图丨甲骨文(来源:资料图)
2023年4月20日,“了不起的甲骨文”小程序正式发布上线。通过该小程序,腾讯与内外各部门合作完成的前期成果得以在用户端和线下的场景展现,而这也是一种探索甲骨文破译线索和打造文创场景的良好方式。
图丨“了不起的甲骨文”小程序(来源:小程序截图)
被誉为“世界第九大奇迹”的三星堆,是20世纪中国最重要的考古发现之一。作为中华文明多元统一的象征,它的背后有着许多非常神奇的故事。
数据显示,截至2022年11月,新发现的6座祭祀坑共有一万七千多件文物出土,但较完整的只有2400多件,占比不到14%。因此,有大量出土文物需要进行修复。不过,文物修复师只有26人,修复时间短则几个月、长则几年的现实状况,给大批量的文物修复工作带来了大难题。
基于此,腾讯希望通过数字化的组合技术,大大提高文物修复的效率和效果。
为此,其打造了一个虚拟空间,在其中尝试设计修复方案,这能避免对文物的损害。在此基础上,进行多种算法的组合,在少量已有的公开文物数据集上建立流程,以验证将AI算法用于文物修复的可行性,并根据前期测试情况扩展至更多其他文物数据上。由于三星堆的文物年代久远、样式复杂,因此现有的算法组合还无法实现完美的修复效果,因此未来腾讯还将继续探索进一步优化的方式。
中国著名建筑学家梁思成说过:“北京独有的壮美秩序就由这条中轴的建立而产生。”2022年,北京中轴线申遗迎来新进展,国家文物局党组确定推荐北京中轴线作为我国2024年世界文化遗产申报项目。
如何还原中轴线700多年的历史发展,让其中的文化得以更好地传承和发展创新呢?这不仅仅是相关部门的工作,更离不开老百姓和社会力量的共同努力。
在这方面,腾讯首先基于多年积累的人机交互、数字孪生等数字技术,开发了“云上中轴”小程序。用户可通过该小程序一览中轴线的壮美风景、了解北京中轴线上的遗产点,参与助力中轴线申遗。据悉,小程序上线仅5个小时,就有50余万公众参与互动。
其还采用游戏引擎、数字建模等方面的技术,创造了一款名为“时空舱”的产品,以数字化全景的形式,反映全长7.8公里的中轴线在700多年间的时空变迁。
同时,腾讯还构建了一个中轴线的数字文化资源库放在开源平台上,希望接下来能够利用AIGC的技术和工具,让技术产生的资源变成优秀的文创产品,成为源源不断、生生不息的原动力,推动中华文化真正地用起来、传承下去。
舒展认为:“虽然我们已经做了很多项目,也使用了非常多的技术,但这只是沧海中的第一步。我们的探索是没有止境的,这个过程也需要各界的加入。”
目前,腾讯SSV数字文化实验室、腾讯研究院、联合国教科文组织驻华代表处、中国文物信息咨询中心、中国文化遗产研究院等单位已经联合发起了“探元计划2023”,致力于深入探索AI、数字孪生、沉浸式体验等新一代数字技术对中华文化传承的推动。“我们希望有更多的高校机构、初创企业,以及有创新想法和方案的团队,能够和腾讯一同在‘AI+文化’的领域中创造无限。”舒展表示。
总体来说,腾讯的“科技文保”工作主要围绕以下三个维度:首先是关心文物保护,希望文物能够在数字世界中实现永生;其次是关心人,关心每一个考古学家、学者和研究者如何做好文物保护和修复工作;同时也关心文物的传承与发展,希望这些文化资源能够以数字化的形式开放和共享,重新焕发生机。
多项AI成果亮相,XMusic入选2023 WAIC“镇馆之宝”
在本届WAIC上,腾讯也展示了多项AI应用成果。
AI通用作曲框架XMusic由腾讯多媒体实验室自研,核心功能在于能够随时随地利用AI辅助进行音乐创作。用户只需上传视频、图片、文字、标签、哼唱等任意内容,即可得到曲调、旋律、节奏可控的高质量音乐,这有助于降低音乐创作门槛,解决用户多样的音乐使用需求。据悉,该成果现已获选本届WAIC的“镇馆之宝”。
图丨2023世界人工智能大会镇馆之宝-腾讯XMusic(来源:资料图)
基于自研AI技术,腾讯对小样本数智人进行了升级,只需要3分钟真人口播视频、100句语音素材,便可得到由平台在24小时之内实时建模并生成的、与真人近似的高清数智人。据了解,数智人制作成本仅在千元级别。
“刷掌支付” 由腾讯优图实验室及微信支付 33号实验室联合打造,基于“掌纹+掌静脉”识别技术,用户只需将手掌置于识别区上方2-3秒,即可完成“无介质”“非接触”“高便捷”“高安全”的支付行为。
采用领域自适应等技术和定制强化语音识别引擎,腾讯正在不断优化其AI同传技术,通过不断提高翻译结果,助力会议信息传递准确和高效。目前,腾讯同传已经多次为WAIC等100多场高级别国际会议提供AI同传服务,也是连续六年为WAIC主论坛提供AI同传服务。而除了科技文保和AI成果,腾讯也在本届WAIC上系统介绍了关于AI大模型的最新进展。
腾讯云MaaS平台再升级,助力行业大模型生根发芽
半个月之前,腾讯云公布了在行业大模型方面的新进展,基于腾讯云TI平台,推出了行业大模型精选商店,致力于为客户提供MaaS(Model-as-a-Service)一站式服务,帮助客户构建专属大模型及智能应用。
(来源:资料图)
通用大模型虽然很强大,但不一定能解决企业的很多具体问题。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在本次WAIC上表示:“企业基于行业大模型构建自己的专属模型,也许是更优的选项。同时也要借助高效的专业工具,不断优化、迭代模型,满足企业和市场持续变化的需求。”
图丨腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生(来源:资料图)
如今,在本届WAIC上,腾讯云宣布MaaS平台迎来再升级,这主要体现在行业大模型技术底座、应用场景和助力科学计算等方面。
在技术底座方面,前不久腾讯发布了自研星脉高性能计算网络和向量数据库,前者能够提升40%的GPU利用率,节省30%-60%的模型训练成本,后者最高可支持10亿级向量检索规模,时延低至毫秒级,为大模型的行业应用打造了更为充沛的算力基础设施。
在应用场景方面,腾讯云的行业大模型能力,已经在金融风控、交互翻译、数智人客服等场景中获得应用。
在科学计算领域,腾讯云的计算能力也已经应用于天文探索和文化领域。比如,用云+AI帮助中国天眼FAST处理海量数据,发现30颗脉冲星和2颗快速射电暴;将多种AI算法综合应用到甲骨文研究中,建立全球最大甲骨文单字数据库。
“AI大模型技术发展和产业探索,离不开产业链协同和生态共建。”腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示,腾讯希望与行业伙伴携手,共同推进大模型在产业领域的创新和落地。
图丨腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声(来源:资料图)
联合发布《人机共生——大模型时代的AI十大趋势报告》
为了推动大模型AI技术发展和产业落地,腾讯研究院、同济大学、腾讯云在本届WAIC上还联合发布了《人机共生——大模型时代的AI十大趋势报告》。该报告包括10个关键性趋势观察,共分为技术、应用和社会三个维度。
图丨腾讯研究院、同济大学、腾讯云共同发布《人机共生——大模型时代的AI十大趋势报告》(来源:资料图)
在技术观察方面,大模型的发展体现出涌现的特征,多模态AI技术正在打造解决复杂问题和实现多模态智能处理的能力。在应用观察方面,AI的发展导致产品交互模式发生变革,给企业生态带来极大的影响。人机交互的革新将赋能个体走向超级生产者的角色,而数智人也有望成为下一代人机交互的入口。在社会观察方面,版权与治理成为当下被AI冲击最明显的两个领域。
AI的发展催生出了一个全民生产力爆发的时代。因此,个体和企业都应该对AI及其趋势发展拥有基本的认知与判断。而该报告旨在提供一个全面、深入、客观的视角,为大众展现基于AI技术和应用的理性思考。人工智能发展的根本目标是落地于产业,服务于人。正如汤道生所言,只有能够真正解决用户需求、距离场景和数据更近的企业,才能拥有大模型的未来。