Utopia人工智能可判断不同社交平台上的仇恨言论数量

2021年04月23日 15:21:28 来自: (0)参与

赫尔辛基--(美国商业资讯)--据芬兰司法部委托Utopia Analytics进行的一项研究,网上仇恨言论最容易出现在论坛上。该报告发现,97%的已识别仇恨言论信息来自于论坛。随后的平台类型是占2.5%的Twitter信息和占0.2%的Instagram信息。而博客、新闻评论和公开的Facebook信息占所有已识别仇恨言论的比例不到0.02%。这些数据集不包括私人讨论,如Facebook组或帐户。

该项目是芬兰司法部 “Facts Against Hate”计划的组成部分,旨在测试人工智能在网络环境中识别仇恨言论的能力。该方法将人类评估与机器学习相结合。项目的一个关键目标是找到仇恨言论的主要渠道,并识别平台之间的差异。

仇恨言论的定义基于社会科学的学术研究结果。该定义通过如下过程完成:首先确定仇恨言论的类别,然后使用类别数据在网络信息数据集中人工识别出仇恨言论的例子。这些标注随后被用作Utopia AI Moderator的训练数据,这是一个利用文本分析和机器学习且与语言无关的工具。该项目的数据集由2020年9月至10月以芬兰语发表的1,200万条在线评论和帖子构成。

结果显示,芬兰公开的社交媒体平台上每月出现大约15万条包含仇恨言论的信息,约占所有信息的1.8%。

在国际公共社交媒体平台中,Twitter似乎最为突出,有7,450条信息被认定为仇恨言论,占所有推文的0.14%。转发在传播这些信息中发挥了重要作用:所有仇恨言论推文中有39%是重复的。

Utopia首席执行官Mari-Sanna Paukkeri博士表示:“尽管数据集主要由芬兰语消息构成,但其他语言中的结果也会非常相似。例如,芬兰仇恨言论的主要平台Ylilauta其实就是大家都熟知的4chan的芬兰版。此外,只需要两周,我们就可以建立一个类似的人工智能模型来识别其他任何语言中的仇恨言论。只需要一位具备相关技能的专业人员告诉我们对应文化和语言中如何定义仇恨言论即可,另外我们还需要具体数据来进行分析。”

媒体库/照片:https://utopiaanalytics.com/media-library

原文版本可在businesswire.com上查阅:https://www.businesswire.com/news/home/20210422005039/en/

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

联系方式:

Janne Huuskonen
总监
janne.huuskonen@utopiaanalytics.com
+358 50 444 0941
utopiaanalytics.com

相关新闻
淘宝网友:红衣a young woman
评论:请别说谎,因为你能骗到的,都是相信你的人。

猫扑网友:笨笨Forever〃
评论:人不如己,尊重别人,己不如人,尊重自己。

腾讯网友:伤好了痕还在
评论:我们这个年龄,更多的是练爱而不是恋爱。

凤凰网友:Pawonx-爱离殇
评论:一切不以睡眠为目的的度周末,都是耍流氓!

搜狐网友:゛野蛮, - /ov3
评论:赚钱像接露水那么辛苦,花钱却像流水那么迅速

本网网友:Cool| 卡其布
评论:你要是嫁人,不要嫁给别人,也不要嫁给我

其它网友:Chafferer  迷心
评论:做女孩一定要经的起谎言,爱的起敷衍,忍的了欺骗,忘得了诺言,放的下一切,最后用笑来伪装你的泪眼!

天猫网友:独白   song
评论:都说炫舞里面的人物身材好,我告诉你,你要是天天那么蹦跶你也瘦。

百度网友:一個人過狠好
评论:世界上最疼痛的话是:“我爱你,但是……”。世界上最甜蜜的话是:“……但是,我爱你”。

网易网友:Emotiona°小吃货
评论:唐僧骑的是神马 , 悟空腾的是浮云 , 八戒爱的是小月月 , 沙僧装的是犀利哥 。

新闻转自网络媒体,如有侵权,请与我们联系:1160322105@qq.com责编:admin