本篇文章1679字,读完约4分钟

一篇自媒体文章不仅引起了公众对马蜂窝在旅游社区平台上的评论被抄袭的质疑,也揭开了马蜂窝互联网行业数据造假的序幕。

在连续几天被问及是否存在内容抄袭或数据欺诈行为后,马蜂窝创始人兼首席执行官陈刚承认,在餐饮和其他评论数据方面存在一些问题,但这远没有外界所表达的那么夸张。然而,业内人士指出,互联网领域的数据欺诈远比想象中的严重,欺诈行为也呈现出一脚比魔术高一脚的趋势。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

从最早的电子商务刷单和赞单,到微信公众账户买粉和刷阅读量,再到网络直播平台买流量和应用机器人用户收费数据,各种数据欺诈手段不断被翻新,真实数据变得高度机密和难以知晓。

没有机制来识别和限制这些惯例吗?事实上,一些平台企业和投资机构已经尝试通过反爬虫、第三方数据调查等技术手段来防范和处理数据欺诈,但效果并不好。此外,出于各种考虑,一些投资机构默许了一些互联网公司的数据欺诈行为,甚至与之串通。技术问题已经成为更加复杂的人类难题。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

最快的进步是伪造的方式

在“马蜂窝”事件中,数据欺诈的一个有问题的常规是,许多用户的旅行策略和在其他平台上的评论被带到了“马蜂窝”。事实上,这种做法并不新鲜。

今年7月,一个活生生的社区“小红树”指责公众评论通过官方微博抄袭了很多用户的内容。具体方法是批量设置虚假账户,复制并携带用户在小红狐发布的原始内容。根据肖红书的估计,剽窃的数量在几百万左右。

一些用户专门为小红书平台创作的内容被复制后,仍然保留着原始内容的影子。小红狐的用户詹朱晓可可在6月6日发了一段视频来庆祝小红狐成立周年。复制后,文案变成了评论的生日快乐,但用户仍然在视频中说小红书,6月6日不是公众评论的生日。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

当时,公众评论的回应是,这是因为新的网上试运营的推荐栏目擅自非法转载了相关内容,所有内容都在第一时间进行了检查和下线,并采用技术手段确保此类问题不再发生。

段敏(化名)自2002年开始从事数据挖掘工作,是中国大数据行业应用最早的开拓者之一。他告诉《中国青年报》:中青在线记者,这种将其他平台的内容传输给自己使用的行为属于一种常见的伪创作和欺诈行为,即通过网络爬虫软件复制其他平台的数据和内容,并稍加修改后将其转换为自己的内容。与其他欺诈手段相比,这种做法更加隐蔽,需要专业人员不断跟踪、分析和比较才能发现。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

段敏表示,除了造假,互联网内容平台上常见的数据欺诈行为还包括虚假数据报告、僵尸用户和虚假行为。由于用户的理解有限,平台和用户之间存在一定的门槛,这往往很难知道;使用机器人模拟真实用户并访问网站或应用程序以增加流量或点击量的虚假行为是普通用户最接近的虚假行为。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

微博、微信等平台是典型代表。2016年9月底,由于微信官方背景调整行为,公众刷号工具的操作被屏蔽,出现了很多真实用户和阅读媒体大V的号码。前一周平均阅读量为数万的公众人数,当天的最低阅读量仅为200;此前,当天阅读超过10万的人数只有2万左右。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

此外,一些音频和视频节目是伪造的。此前,在中国首例因刷视频网站引发的不正当竞争案件中,被告杭州费祎信息技术有限公司因刷iQiyi、优酷土豆、腾讯视频等主流视频网站视频内容刷视频节目1万次,仅收取15元。

上海市徐汇区人民法院公布的信息显示,费祎公司的许多员工通过多个域名和不断更换访问ip地址的方式,不断访问爱奇艺网站视频,视频访问量在短时间内迅速增加。仅从2017年2月1日至6月1日,费祎公司在爱奇艺网站上的虚假访问量就不下9.5亿次,按照公司每万元收费标准15元,非法获利数百万元。

刷量、买粉、伪创作… 数据造假最终受伤的是谁?

技术的发展降低了欺诈的成本

与“刷粉买粉”、“造假”等内容平台的欺诈行为相比,在互联网平台上夸大用户和产品的交易数据是一种更直接、更困难的数据欺诈方式。

2015年,一位业内技术人员在著名的智湖社区发布了这条消息。通过回溯编译蜻蜓调频软件的安卓版本,他发现蜻蜓调频软件中隐藏着名为普罗米修斯和宙斯的强制自启动代码。前者可以在用户不知情的情况下,在手机的后台启动一个无窗口的透明界面;后者可以独立触发广告主的广告,并将其发送回第三方数据公司,从而完成用户自主点击广告的操作。

标题:刷量、买粉、伪创作… 数据造假最终受伤的是谁?

地址:http://www.ictaa.cn/hlwxw/4925.html