草榴,微信的下一个强劲对手?

图文精选 节操大魔王 2年前 (2015-10-24) 661次浏览 已收录 0个评论

没错,伟大的 1024 论坛在开发基于社交的 APP 了。

在这个地球上,每秒钟有 28258 人在观看色情网站,同时每秒也花费 3075.64 美元在色情网站上。如果你不清楚这两个瞬时数据意味着什么,灰灰能告诉你的是,色情信息实际上占用了全球互联网近 1/3 的流量。

所以建立在色情需求上的移动社交崛起并不奇怪,国内的陌陌就是一个最好的例子。事实上,微信在早期也是以“约炮神器”的思路在米聊等同质产品中脱颖而出的。

互联网色情产业是互联网专业研究机构的重要分析对象之一。现在,真正的行业大佬要直接用流量优势打造社交帝国了。灰灰在此建议尤其作为新媒体从业者,这是一件或多或少你应该去关注的事情。

移动端2.0版APP界面曝光▼

新时代的我们 1024表世界论坛

类别: Photo & Video

版本: 2.0

大小: 15.5 MB

开发商: Dehua Han

费用:$3.99

简体中文

iPhone5 优化

无内置收费

Game Center

安装后有机会获得论坛本身的邀请码。当然,灰灰无意传播色情信息,所以这里不会告诉大家下载链接。

从 VI 设计上,草榴论坛旗下的这一产品倒是一举突破了 PC 端毫无美感的布局方式,比如“技术讨论区”采用了当下新闻类产品的模型。▼

正文;摘要;缩略图;发布者;阅读量;评论量;发布时间一应俱全。干净整洁的界面体验,这种类似布局的还有“今日头条”等。

灰灰对比了一下纯粹以“找资源”为功能导向的 PC 端视觉设计▼

我们显然可以发现,移动社交已经是高于底层需求的互联网用户行为,所以在移动端产品的 VI 设计上,草榴是比较考究的。▼

底部很明确地可以看到,有“消息”和“发现”等可能基于通讯录甚至 LBS 的社交入口。

那么草榴本身的流量优势到底有多大?我们先来看一组去年的数据可视化报告▼

说到猎豹浏览器和 1024 论坛的暧昧关系,大家有没有见过这个神广告▼

这个广告于去年10月24日发布。转眼一年后的今天,它又有了怎样的数据表现?灰灰带你来看看最新的一份数据分析:揭秘草榴社区的运营现状和用户习惯。(顺带请承受住这位码农一惊一乍的评语)

作者简介:李焕朋,非全职开发者,开源社区文化爱好者。招标行业从业人员,业余时间喜欢研究unix系统和web数据挖掘。

草榴社区在今年5月份陷入关站风波,把它再一次推到风口浪尖上。然而风波过后,该怎样还是怎样,这可能印证一句话“不管你是谁,都无法抹杀本能。”本项目是基于“使用PHP语言对网络数据进行采集与分析”的一次实验。可视化结果不包含淫秽色情信息,营造健康上网环境从你我做起!

采集到的统计数据样本说明数据来源:草榴网站《达盖尔的旗帜》版块 100内容, 时间跨度2015060520150907。选择此版块是因为这个版的内容都是由注册的用户生产的,具有一定的分析价值。 8537条主题帖的标题、发帖时间、每条主题的回帖数量、发帖用户。(共由576个用户生产)12,8841张图片的图床绝对链接地址 1,4568页回复帖 13,0704条回复的发表用户、回帖日期时间 1,1250个用户的用户名、注册时间、最后登陆时间项目技术结构数据采集:PHP、CURL扩展结构化数据存储:MysqlHtml解析: SimpleHtmlDom中文分词: PSCWS4前端展示: BootStrap数据可视化:HighCharts

▲从 8537条主题信息中总共提取出了 576个用户,三个月中平均每个用户发表 14.8篇主题 排名第一的用户发帖数量更是达到了276篇。猜测一下,看来所有的网站都需要一部分活(bān)跃(yùn)用(gōng)户充实内容啊。这里面真正的原创帖的比例能占到多少已经不重要了,内容才是王道!

▲当我码完这段js代码刷新浏览器查看结果的时候,整个人都不好了!城会玩!城会玩啊!大家看排名第1和第6的关键词(女友,自拍,少妇,身材,情人,老婆), 把和自己女朋友、老婆XXOO的照片分享出来真的那么好玩儿么。另外,让我们回归到小学语文课,来,请用以上关键词造句……你用上面的词组成的句子就是发帖者们所热衷的事情……

▲可能只看这一张图是没有很大的代表性的,表面上只能看出从8月份开始主题新增数量开始大步的上涨,什么原因导致的呢, 过一会在下面看到用户新增情况图的时候就会恍然大悟,对,大量新用户的加入。

▲这张图代表的是11250个用户账号分别是那一年注册的,可以看出2007-2010年和2011-2014年这两个时间段相对数量还是比较平均的,50.6%的用户是在今年注册的,难道今年大范围的开放注册了?

▲这张折线图和上面的那张基本展示的信息是类似的,分类精确到每个月。

那么问题来了,这么多东西都是存在哪里的呢?

 

▲从128841个图片url中提取出来的图片网盘,ihostimg.com 毫无疑问遥遥领先,难道这是CL的副业?这之间到底有什么 千丝万缕的联系我先不瞎猜了,感兴趣的朋友可以自己想办法再去了解(不用梯子也可以访问!)。

另外,大家注意排名倒数第二的图片网盘, sinaimg,对,就是你知道的那个新浪,sinaimg是新浪旗下的开放云存储服务,“新浪作为国内10多年领先掌握全国最先进的全分布式系统架构和存储技术之一的公司,为你的 XXOO私密照片存储提供一站式解决方案” 233333……

风波之后,草榴的运营数据怎么样

▲理论上说,只要是网站继续正常运营下去,且无论统计哪个时间段,这个图会一直保持这个状态,统计数据的基础是11250个 账号的最后一次的登陆时间,每次登陆都会用新的覆盖旧的,右边的顶点越高代表了用户重复登陆的次数越多,网站的运营越正常。

▲130704条回复帖的时间段分布情况,从8月份开始互动明显越来越多。单独看意义不大,只能看到最近互动增多,但是通过与 每日主题发表数量和新增用户图放在一起看,这三个趋势是成正比的,注册用户增多导致新增主题帖增多,不断的新内容产生带动了论坛的 活跃度,从而产生了更多的互动回复内容。

▲这张图的数据是从13074条回帖时间统计出来的,其实这张图的最终结果和我预计的还是有挺大差距的,原本我以为用户 访问的高峰期会是晚上的9点-12点,而真实的用户在线高峰期顶点确是上午的10点,10点不是大家刚刚开始投入工作的时间么。(OMG,我发现了什么)

后记:

忘记了从哪里看到过一句话:“互联网上没有垃圾信息,只有放错位置的资源”,web数据挖掘方面还是很值得研究的,开发语言也没有优劣, 用自己最熟悉的语言去解决问题就是最好的实现方式。先解决问题,再优化过程,结果最重要!此次试验仅仅针对CL的一个版块进行了表面数据 的分析,我相信,如果更用心的话还能分析出更多的其他东西。比如:将采集到的10几万张图片下载下来,是不是可以作为图像识别系统识别色情图片的 训练素材?我只是采集了注册用户的用户名、注册时间、最后登陆时间等有限的几个字段,如果把用户在论坛内的等级、贡献值、回帖数量等信息也采集下来 结合其他字段进行加工和分析是不是能得出更多的有意义的结论呢?

作者email: 2705313595@qq.com

在线版地址:http://1024data.sinaapp.com

除了基于移动社交的“1024表世界论坛”,草榴当然也有自己传统的论坛版 APP,如它的官方推特所示于今年8月更新到3.0.0版。▼

草榴还仅仅是全球色情产业中的小小一部分。

世界上最大的色情网站 Xvideos 每月有44亿的流量,这个数字是 CNN 官网或24小时专门播放体育节目 ESPN 电视网的流量的3倍,是社交新闻网站 Reddit 的2倍。YouPorn、Tube8 和 Pornhub 这些大型的色情网站,其流量也可以让除了 Google 和 Facebook 等超大型网站之外的小网站们相形见绌。

而排名第二的 YouPorn 有超过 100TB 的色情资料,每天的页面流量超过1亿,这就意味着它每天的资料传输量有 950TB 之多,大多数的资料传送用在了载入影片上。按照上面的资料计算,YouPorn 每月的资料处理量有 28PB,因此,排名第一的 Xvideos 的资料传送肯定不止29PB,它每月的资料传送量估计在35到40PB之间。在高峰时间段,YouPorn每秒需要处理 100GB(每秒 800Gb)的资料量,这个资料量等于 YouPorn 每秒传送了10多张双层的DVD。

网路只能处理50Tb每秒的资料,换而言之,单单一个YouPorn的流量就占了整个网路网的2%。类似 YouPorn 这样的色情网站有数十个之多,因此,认为色情网站的资料传送量占据整个网路的30%就不算夸张了。

如果它们也都来做移动社交……哎,真是难以想象。


节操报 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明草榴,微信的下一个强劲对手?
喜欢 (0)
[微信红包打赏]
分享 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址