历史上的今天
今天是:2025年01月21日(星期二)
2021年01月21日 | 谣言不止可止于智者 腾讯谣言识别方法来帮忙
2021-01-21 来源:爱集微
随着网络的发展,越来越多的用户通过分享视频、音频或文本等信息的方式进行社交活动,尤其是短视频作为越来越流行的媒体传播载体,受到了越来越多人的关注。
但是,用户分享的信息却可能是谣言,这些谣言会通过网络快速且广泛的在人群中传播,而视频这一媒体形态的发展使得大量不可靠的信息以视频谣言等多媒体谣言形式快速且广泛地在人群中传播。因此,随着传播途径变得越来越丰富,不确定性的谣言更加有可能会引起网民的恐慌,进而影响人们正常的生活秩序。
为此,腾讯在2020年9月15日申请了一项名为“谣言识别方法、装置、设备及存储介质”的发明专利(申请号:202010968143.7),申请人为腾讯科技(深圳)有限公司。
根据该专利目前公开的资料,让我们一起来看看这项谣言识别方法吧。

如上图,为该专利中发明的谣言识别方法的流程示意图,首先,系统会获取待识别对象的标题以及文本内容(第一信息),如果该对象为音频或者视频元素,则会通过音频转文字、视频中图像识别等技术来获取字幕、弹幕等文本内容,如下图所示。

上图中展示了四帧视频图像,分别为61、62、63以及64,且按照从早到晚的顺序依次排列,其中61、63和64包含有文本信息,而62不包括文本信息,借助于该视频中文字提取技术,就可以对其中的文字信息进行提取:
图像61中的文本信息包括: “腾讯视频”以及“两只老虎,两只老虎,跑得快,跑得快,”;图像63中的文本信息包括: “腾讯视频”、 “一只没有眼睛,一只没有尾巴,”以及“哈哈!真好笑”;图像64中的文本信息包括: “腾讯视频”、 “真奇怪!真奇怪!”以及“用户1:哈哈!真好笑”。
而当面对较为复杂的视频时,由于声音会存在例如背景音乐等干扰,因此该专利结合了音频和视频的方式,基于计算机视觉技术从视频包含的图像中获得文本,以弥补音频的缺陷。其次,系统会基于标题与预设的谣言标题类型的从属关系,来判断初始获得的信息(第一信息)是否为谣言,记录为第一结果。
但是标题所包含的信息是非常有限的,因此,系统会同时根据获得的文本内容来判断初始信息是否为谣言,记录为第二结果。最后,通过对比第一结果以及第二结果,就可以较为准确的判断待识别的对象是否为谣言。

如上图,为该专利中方法所对应的技术体系架构示意图,这种谣言识别方法可以从六个维度对第一信息进行分析,从而对第一信息进行全方位的把控,以使得到的最终结果更加准确,这六个维度分别为:维度41(标题)、维度42(简介信息)、维度43(文本内容)、维度44(音频)、维度45(画面变换特征)以及维度46(视频中视频图像包含的内容)。
同时,该专利还根据谣言识别的标题,大致将生活中常见的谣言划分为以下四类谣言标题类型:
1)政治类型,即带有明显政治斗争目或者意识形态,与政治话题比较相关的谣言视频的标题所属类型;
2)欺诈类型,利用人们的同情心或者追求利益的心理,骗取人们大量关注或转发的谣言视频的标题所属类型;
3)常识类型,关于扭曲自然类常识、历史类常识、生活类常识来吸引人们注意力的谣言视频的标题所属类型;
4)社会娱乐生活类型,为关于社会各界人物的花边新闻或者娱乐圈不实新闻的视频谣言的标题所属类型。
从体系架构图中,我们还可以发现有一种较为流行的谣言标题类型:标题党类型,就是指各类真假难辨、危言耸听、甚至蛊惑恐吓的标题所属类型。目前,为了吸引网友的眼球,标题制作底限不断被刷新,各类真假难辨、危言耸听、甚至蛊惑恐吓的标题层出不穷。例如,标题“山寨春晚融资百万或请郭德纲表演相声”、标题“刘翔或参见东亚运动会”等属于标题党类型,而借助于该专利中发明的方法,就可以实现对这些“标题党”信息进行精准的判断。
以上就是腾讯发明的谣言识别方法,该方法在识别谣言时,至少从标题和文本内容两个维度上分别来分析,从而得到两个判断结果,再综合两个结果一起来判断该信息是否属于谣言,由此得到的最终结果将会更加准确。而在互联网日益发达的今天,这样的智能化谣言识别手段也确实十分实用,可以帮助文字、视频平台甄别出虚假内容,也为用户提供了更加良好的网络环境。
史海拾趣
|
小弟今日购买了一款AD6654/PCBZ评估板,在测试过程中出现几个问题,ADI的售后服务真是不敢恭维,一点忙也帮不上,主要的问题是在使用配套的软件AD6654 Evaluation Software 的过程中,在关于NCO频率的设置的一栏中,几个参数怎么设计 ...… 查看全部问答> |
|
由于嵌入式机器rom的限制,在定制wince内核的时候,不加入MFC,然而后来在后续开发中发现需要使用消息队列,假如消息后重新定制,在PB中发现始终无法使用GetMessage(加入了库函数和lib文件),困惑 请教:不加入MFC及其他.Net Framwork的东西,只加 ...… 查看全部问答> |
|
我用AVR128的串口进行数据收发,接收用中断方式,单步执行时,发现数据不能全部接受到,掉了几个字节,也就造成我对这个数组的CRC校验出错,全速运行时,字节全部接收正确,但对接收数组的数据的CRC校验还是错,请问是什么原因呢??急… 查看全部问答> |
|
以前用的是V3.0的固件库,使用的是固件库中文手册,它把每个参数的含义以及每个子函数的示例都有,这样使用或查找起来很方便。 现在使用V3.5的库,感觉改动的还是很大的,现在只有CHM文件了,没有使用手册了,不知道大家是如何看这个文件及使用的 ...… 查看全部问答> |




