历史上的今天
返回首页

历史上的今天

今天是:2025年04月23日(星期三)

正在发生

2018年04月23日 | 人工智能时代,如何做到内容为王?

2018-04-23 来源:eefocus

近日,短视频APP成为众矢之的。因相关短视频内容涉未成年人低俗不良信息,国家网信办相继约谈了快手和今日头条旗下火山小视频相关负责人,提出严肃批评并责令全面整改。之后,微信、QQ也将在互联网短视频整治期间暂停短视频APP外链直接播放功能,涉及的APP包括微视、快手、抖音、西瓜视频等。

 

新媒体时代,用户每天生产的内容都在爆发式增长,在这些新生产的内容里通常存在着大量的不良内容,会使得用户产生反感,甚至触犯法律,这时就需要对这些新生产的内容进行审核,而传统的人工审核方式已经跟不上爆发式增长的内容量,人工智能时代,如何做好内容开放平台建设成为业内人士关注的热点。

 

4月21日,由DataFun、数据猿联合微软加速器主办的主题为“人工智能时代:内容审核与流量反作弊”活动在微软亚太研发集团总部举行。本期活动邀请了曾参与、负责360等多家公司内容开放平台建设的资深算法研发工程师刘路、爱奇艺流量反作弊项目负责人张晓明和数美科技联合创始人&CTO梁堃从内容、流量等方面分享了人工智能时代,平台的内容审核与流量反作弊是如何完成的。

 

当下,内容开放平台有三种类型:用户生产内容、专业生产内容和职业生产内容。大众点评、地图属于典型的用户生产内容;豆瓣、知乎属于典型的专业生产内容;微信公众号、抖音属于职业生产内容。内容开放平台的强社交性、强随机性和强运营性带来的主要问题和矛盾为广告主和消费者之间的矛盾,内容质量和内容之间的矛盾以及流量和质量之间的矛盾。

 

刘路 资深算法研发工程师

 

刘路认为建设一个行之有效的信用体系是内容开放平台解决这些矛盾的关键。一个常规的信用体系建设架构涉及到内容生产者和用户。内容生产者提交了内容之后去做个人信用和内容审核,审核需要利用大数据风控和信用评级功能,如果审核不通过内容生产者需要进行申诉,两方面审核均通过则可发布内容,之后可进行AB测试和分级发布,而内容发布之后需要进行风险评估,从而判断该内容是否需要召回,并设置相应的召回策略。

 

刘路特别指出,在内容方面需要设置层层关卡,低信用内容需要被内容信任监控,高信用内容则需设置内容被举报监控,从而最大程度地清除内容开放平台的不合规内容。

 

当下,视频网站已经形成一条灰色产业链,一些视频平台默认刷量行为,广告展现量中超过20%是虚假的。同时,刷量的流程已经高度程序化,业界缺乏合理的监管。而对于广告主,流量造假与欺诈行为无异。如今,各大视频网站发展十分迅速,如何在用户量较大的情况下,做好流量反作弊?爱奇艺流量反作弊项目负责人张晓明分享了爱奇艺流量反作弊的“术”与“道”。

 

张晓明 爱奇艺流量反作弊项目负责人 研究员

 

在业界,对于流量反作弊并没有统一的定义,在张晓明看来流量反作弊是制造非用户产生或带有一定目的性的数据,并且有机器作弊和人工作弊两种形式。其中机器作弊包括模仿投递日志、调用接口,这种形式设定模式相对固定,短期效果明显;人工作弊则包括微信群、QQ群以及由专人指导的专业APP,指导操作并与用户分成,这种模式不固定,效果与组织规模有关。

 

利用这两模式进行直播刷人气、网站刷广告、电视剧和商品刷流量,会使得正常用户对产品的判定标准失衡、企业信誉受损、数据分析不准确和成本上升等多种伤害。

 

在张晓明看来,流量反作弊具有被动防守、事后分析,业务场景复杂、没有通用模型,持续旧规则不断更新新规则等特点,如何进行有效地流量反作弊?基于以往的业务经验,张晓明表示,进行行之有效的流量反作弊需要做好前期的准备工作:掌握投递日志或者数据库中的元数据含义,掌握主体业务的工作模式和场景,避免信息孤岛,了解作弊的目的是什么以及与业务部门进行良好的沟通确认作弊的口径并做好保密工作。准备工作完成之后,在技术方面进行IP信誉、安全画像、加密信息检测和设备硬件信息检测;在业务方面进行规则统计和机器学习。

 

随着移动互联网的发展,人们的衣、食、住、行各个方面都结合在了一起,这给黑色产业带来了很大的盈利空间。在金融领域有借贷欺诈、盗卡交易、洗钱套现等模式;在电商行业有刷榜、促销活动欺诈等形式;在游戏方面有黑卡、挂机等现象;在社交方面有淫秽色情发帖、欺诈广告等现象。

 

梁 堃  数美科技 联合创始人&CTO

 

梁堃表示,面对这些欺诈行为企业采取了相应的措施,但多数企业缺乏全局的风险数据支撑和专业的反欺诈人才团队,随着UGC内容的内在复杂性越来越高,黑产技术水平与专业程度的不断提高,企业面临的挑战越来越多。

 

当天,基于以往的经验梁堃分享了在内容反欺诈方面的一些经验。他表示,UGC场景包括头像、昵称、发帖、弹幕、评论、个人描述、私信、群聊等,UGC带来的问题:诈骗、广告、色情、暴恐等文本、图片、语音UGC内容。同一个内容在不同的场景下含义不同,单一的关键字黑名单或单一模型极易造成大量误杀,影响用户体验,使用深度学习(RNN)、SVC善NLP技术针对语意理解的不同方面分别建立不同的模型,从多个纬度检测语意环境。采用Char & Word Embedding自动识别数万种敏感词变体、微信/QQ/手机号等联系方式变体,采用基于CRF的序列标注自动识别并排除干扰。

 

如今,骗子们分工明确,形成了庞大的黑色产业链。随着人工智能时代的到来,通过大数据、机器学习等技术势必将打击黑产进行到底。


推荐阅读

史海拾趣

BH Electronics公司的发展小趣事

近年来,随着环保意识的提高,BH Electronics积极响应国家绿色发展的号召,开始了绿色转型之路。公司加大了对环保技术的研发和应用力度,推出了一系列绿色环保产品。同时,BH Electronics还优化了生产流程,减少了能源消耗和废物排放。这些举措不仅提升了公司的环保形象,也为公司的可持续发展注入了新的动力。

这五个故事只是BH Electronics发展历程中的一部分,但它们却生动地展现了这家公司在电子行业中的崛起之路。从初创时期的筚路蓝缕,到技术创新的突破;从国际化战略的拓展,到品质管理的提升;再到绿色发展的转型,BH Electronics始终保持着敏锐的市场洞察力和不懈的创新精神。正是这些因素的共同作用,使得BH Electronics能够在激烈的市场竞争中脱颖而出,成为电子行业中的佼佼者。

ACEINNA公司的发展小趣事

近年来,随着环保意识的提高,BH Electronics积极响应国家绿色发展的号召,开始了绿色转型之路。公司加大了对环保技术的研发和应用力度,推出了一系列绿色环保产品。同时,BH Electronics还优化了生产流程,减少了能源消耗和废物排放。这些举措不仅提升了公司的环保形象,也为公司的可持续发展注入了新的动力。

这五个故事只是BH Electronics发展历程中的一部分,但它们却生动地展现了这家公司在电子行业中的崛起之路。从初创时期的筚路蓝缕,到技术创新的突破;从国际化战略的拓展,到品质管理的提升;再到绿色发展的转型,BH Electronics始终保持着敏锐的市场洞察力和不懈的创新精神。正是这些因素的共同作用,使得BH Electronics能够在激烈的市场竞争中脱颖而出,成为电子行业中的佼佼者。

EPIGAP公司的发展小趣事

随着公司业务的不断拓展,EPIGAP公司意识到单靠自身力量难以应对日益复杂的市场环境。于是,公司开始积极寻求与产业链上下游企业的战略合作。通过与原材料供应商、代工厂商以及终端客户的紧密合作,EPIGAP公司实现了产业链的整合优化,提高了整体运营效率。这一战略不仅降低了公司的运营成本,还增强了公司的市场竞争力。

华宇创公司的发展小趣事

随着市场的不断发展,华宇创意识到单一产品无法满足日益增长的市场需求。于是,公司加大了对研发的投入,积极引进高端人才,与国内外知名科研机构建立合作关系。经过不懈努力,华宇创成功研发出一系列智能电子设备,包括智能手表、智能眼镜、智能家居控制器等。这些新产品的推出不仅丰富了公司的产品线,也进一步提升了华宇创的市场竞争力。

EM Microelectronic-Marin SA公司的发展小趣事

多年来,EM Microelectronic-Marin始终保持着对技术的热爱和追求。公司不断投入资源进行研发,推动电子技术的持续发展。在未来,随着物联网、人工智能等技术的不断兴起,EM Microelectronic-Marin将继续致力于技术创新和产品升级,为电子行业的发展贡献自己的力量。

DINTEK公司的发展小趣事

随着RFID技术的广泛应用,制定统一的国际标准变得尤为重要。EM Microelectronic-Marin积极参与了RFID标准制定机构的讨论,与其他企业一起提交了RFID标准建议。这一过程中,公司不断推动技术创新,力求在标准制定中占据有利地位。虽然最终的标准之争结果未知,但EM Microelectronic-Marin的技术实力和创新精神得到了业界的广泛认可。

问答坊 | AI 解惑

PLM系统在汽车产品开发中的应用

  汽车工业是一个技术高度密集的成熟产业,是当今许多新技术的载体,而汽车的新产品开发则是汽车技术的核心。当代汽车新产品的开发,从它的基本理念、组织形式、实施步骤和开发手段上都贯穿着信息技术和微电子技术的成果,已经达到了全新化的 ...…

查看全部问答>

绝缘子带电检测仪(电场法)

高压输电线路绝缘子内缺陷带电检测装置专利号:ZL 02 2 40245.4华北电力大学(北京)网上宣传很多,唯有我们学校在生产,望慎重甄别,以防假冒!010-60120676 13601208165 okgod123@126.com 于老师    用电场法原理,整体水平达到国 ...…

查看全部问答>

CRC16_32 C 实例与硬件CRC 精解

CRC是一个必备的工具。这个CRC符合MSP430与STM32的硬件CRC算法。 …

查看全部问答>

多了保护LM317

多了保护LM317可调稳压电源…

查看全部问答>

元旦散分!

祝大家新年快乐!…

查看全部问答>

寻求WINCE5.0系统下的软件高手

帮我把里面的一个学习软件破解掉,让它能在另外一台WINCE5.0的系统上运行,都是ARM9架构的 我QQ:76697046 如果在深圳最好,可以当面交流嘿嘿…

查看全部问答>

华为招聘(更新)

要求:本科三年工作经验,硕士两年。电信、通讯行业相关。 编程语言:C/C++/JAVA 工作地点:南京、深圳 待遇:够牛的可以和老大讨价还价,绝对优厚(至少有个7、8K)。 满足要求者请将简历发送到songguiyong@huawei.com。…

查看全部问答>

RFID技术让你能听墓碑里的人说话

本帖最后由 jameswangsynnex 于 2015-3-3 19:59 编辑 当我们去拜谒逝者、或在陌生人的墓碑前经过时,是否感觉到一个人自言自语有些无聊呢?想不想让坟墓里面的人也说点什么?   RosettaStone是一家提供“科技型纪念产品”的公司,他们推出了一款 ...…

查看全部问答>

TPS2491可以控制的最大功率为多少?

TPS2491可以控制的最大功率为多少? TPS2491是使用外扩MOSFET的,问题:TPS2491是否可以稳定的控制外扩功率达3KW的应用呢? …

查看全部问答>

地平面分割和跨分割信号线的问题

4层板 地平面分割后只在一点连接,两区之间的信号线怎么不跨分割呢?比如单片机出来的脉冲信号有送去给模拟电路的时候。 而且单片机下面的地要怎么分割,除了内置ADC相关的引脚,其它区域都铺数字地吗?类似的,像DAC和ADC要跨分割沟来放可以吗? ...…

查看全部问答>