世界热讯:MiduCMR，跨模态信息检索与数字媒体的智能碰撞

近日，数据智能应用服务商蜜度发布了人工智能前沿应用成果——跨模态检索引擎MiduCMR，实现从数据融合到实际应用的重大突破。

“跨模态信息检索”通常指从互联网的全媒体多模态信息中，提取视频、音频、图片、文本内容并对其进行单模态理解和多模态融合，其难点在于自动理解、关联不同模态数据之间的关键要素，并实现相对准确的交叉匹配。

MiduCMR利用跨模态对比学习、语义融合、语义表征、语义检索等技术，实现了跨模态视频打标签、相似视频检索、场景识别等一系列解决方案，为政企与媒体数字化转型提供场景化的数据智能服务。跨模态信息检索与数字媒体如何产生“化学反应”？

(资料图片)

善用跨模态信息检索 – 全媒体助跑工具

智能媒体时代，媒体工作者如何应对网络中海量的碎片化信息，如何兼顾媒体内容生产者与媒体信息传播者的两重身份，成为一大挑战。

MiduCMR跨模态信息检索引擎，让媒体工作者实现高效信息交互，助力媒体资源整合。

●精准溯源信息辨别事件真伪

如何快速、准确地聚焦热点话题及背景信息，是媒体从业者跑赢信息发布速度的一大关键。利用MiduCMR，通过输入事件画面的文字描述，几秒钟便可以检索到全网几百条相关数据，涵盖文本、图片、视频等模态数据以及具体数据量，并对其作出发布渠道、发布时间、发布地点等标记。

媒体工作者不仅能够通过MiduCMR发现素材，还能了解到信息短时传播范围、信息发布主要集中地，甚至追溯信息来源，为了解事件的来龙去脉、验证事件的准确性及真实性提供重要依据。

●搜索海量素材激发创作灵感

在媒体内容创作过程中，与文字适配的图像对于内容塑造、提高读者视觉感受有重要作用。但一些常用的搜索引擎难以完全命中搜索场景的关键元素。例如在“女孩在青青草原中看夕阳西下”场景中包含女孩、草原、夕阳三个要素。部分常用搜索引擎往往只命中1-2个要素。而MiduCMR强大的跨模态信息检索能力，能够准确解析文本、图片、视频中的字幕、背景等特征元素，以三大搜索特征优势打破与搜索引擎之间的“交流障碍”。

一是搜索结果精度更高。在同样的搜索词下，MiduCMR展现的内容同时命中“女孩、草原、夕阳”三个画面要素。

二是搜索方式更加广泛。上传画面图片，即可检索出类似场景的图片与视频，突破以往仅能通过文字搜索的局限，帮助缩小素材搜寻范围，提升搜索效率。

三是情感识别度更准确。MiduCMR能够根据文字语义的情绪分析与识别匹配相应的信息。

●传播效果评估作品侵权洞察

面对众多热点选题及媒体内容，如何制定传播策略？如何选择媒介？分析与评估发布内容在各平台的传播效果尤为重要。通过MiduCMR上传原创图片或视频，发现全网发布过相似内容的平台及账号，爆款内容及引爆平台便一目了然。

MiduCMR还可以根据上传的原创文本、图片、音视频，发现作品在全网类似应用场景，无论是原创图片被加进视频中，还是视频文案被复制粘贴成文章……MiduCMR都能第一时间检索到这些“抄袭动作”，帮助维护版权利益。

当前，基于MiduCMR的蜜度索骥已支持约300个特殊场景的识别分析，可以有效提高媒体对文本、图片、视频、音频等多模态内容发现、评估、分析的效率，帮助媒体收集素材、辨别新闻事件真伪、评估传播效果等。

基于MiduCMR的蜜度版权通已经支持全网多场景中的版权保护，能够帮助文本版权、图片版权、视频版权的监测、预警、追踪与智能取证。

未来，蜜度将基于MiduCMR推出更多的数据智能产品和解决方案，为数字媒体的使用场景助力赋能。

（图片由蜜度提供）