我们这一代人对于童年的记忆绿坝·花季护航,多少都会有掐着点看父母什么时候回家,然后火速关掉电脑的经历,有些人可能还要把电脑上的蕾丝罩布形状复原。或者是偷偷通过电话充值Q币装饰QQ空间,在月底父母看着电话费单困惑时装作一脸无辜。如果是男孩子,可能还会有偷偷去网吧的经历。
这些小小的刺激绿坝·花季护航,基本都建立在家长对于娱乐的严格管制上,上网、网游、网恋都被视作洪水猛兽。其实今天回头看看,和中国互联网一起野蛮生长的一代人,与互联网相伴的路径还真的有点惊险。当脱离了少年心气,才会觉得当初唾手可得的色情暴力不当内容,对于儿童和青少年来说其实是并不合适的。
其实政府组织早就意识到了这一问题,2008年,原来的信息产业部绿坝·花季护航、今天的工信部,公开向社会征集绿色上网过滤软件。在原本的设想中,绿色上网几乎算是一种分级制度,预装在个人电脑中,为青少年和儿童过滤不良信息和图片——但这并不影响成年人如何使用网络。
这次招标为我们带来的,是一次近乎闹剧的失败的儿童网络保护行动,和至今仍然无法解决的儿童网络安全问题。
一个失败的起点:
绿坝闹剧始末
绿坝,是这一切的开始。
在工信部公开招标后,中标的分别是北京大正语言知识处理科技有限公司和郑州金惠计算机系统工程有限公司两家企业,金惠提供“金惠堵截黄色图像及不良信息专家系统”,也就是图像上的识别和拦截,而北京大正提供语言文字上的识别。双方合作,研发了“绿坝·花季护航”这款过滤软件。
工信部花费了4170万元,购买了绿坝一年的使用权,提供给网民免费下载和使用到2010年5月。并下发了《关于计算机预装绿色上网过滤软件的通知》,要求09年7月之后我国境内生产销售的个人计算机必须预装绿坝。
但很快强制安装绿坝的行为就遭到了巨大的反弹,其中最主要的原因,是绿坝自己不够争气。
很多使用者表示,绿坝的图像过滤基本就是个笑话。只要是以黄色为主(此处指的是向日葵一样的黄色)、掺杂黑色的图片都会被过滤掉,导致打开绿坝之后连地图都看不了。即使关闭绿坝,也会和一些日常管理软件产生冲突。例如北京很多中小学校因为安装了绿坝,连学籍管理、评价等软件都不能正常打开,只好把批量安装的绿坝批量卸载。
除了不够好用之外,绿坝是否会侵犯个人隐私、是否会影响计算机安全,具体拦截哪些网站有没有公开透明的标准、是否会影响信息自由和商业自由等等,都是人们怀疑的问题。
很快在2009年6月30日,《通知》上规定强制安装绿坝的前一天,信部新闻发言人称由于“一些企业提出工作量大、时间仓促、准备不足,根据实际情况,可以推迟预装绿坝软件。这款价值4000万/年的项目终于不了了之,并且逐渐被人们遗忘。
错误的时间和错误的技术
绿坝失败的原因究竟是什么?
即使抛开郑州金惠和北京正大两家企业中标的公平性,光从技术角度来看,绿坝的失败也是必然。
先从郑州金惠说起,郑州金惠所提供的技术名为“金惠堵截黄色图像及不良信息专家系统”,所谓专家系统就是人工智能的一个研究分支,将某一领域的人类专家知识和经验大量录入计算机,以实现让计算机模拟人类推理、判断的过程。
人类信息实在太过丰富,谁来判断信息的准确专业、谁来录入信息,都是无法解决的巨大问题。所以专家系统大多被应用在极细分的领域,比如某一种虫子可能会对某一种农作物造成的损失等等。
显然,专家系统是不适用于识别色情图片这样极为泛化的问题的,从表现来看,金惠也没能建立出一个足够强大的鉴黄专家系统。
再看北京正大,北京正大提出了一套概念层次网络(Hierarchical Network of Concepts)理论,指出“把人脑认知结构分为局部和全局两类联想脉络”,“建立自然语言的表述和处理模式,使计算机能够模拟人脑的语言感知功能”。北京正大自己的说法虽然云里雾里,但我们仍然可以捕捉到“模仿人脑”这个关键词。北京正大提出的模仿人脑,很可能是应用类似今天深度学习的方式,像大脑一样通过视觉、听觉传感提取边缘特征再进行高级分类。
但我们已经知道,深度学习依赖的是量级极大的数据和算力。就拿2012年谷歌启动的谷歌大脑项目来说,利用了16000个CPU进行并行计算才让机器能够识别出猫的图片。
在2008年的中国,我们很难相信哪一家企业有能力处理如此繁重的计算任务,绿坝的失败也就不足为奇了。
总之如果聚焦于技术,绿坝失败的本质来自技术水平本身的限制和算力、数据等硬性条件的不足。其实这种失败也不仅仅出现在中国,例如几年前印尼也推出了一款名为Internet Positif的网络信息过滤服务。和绿坝一样,不光推广起来很困难,还同样遭遇了被萌化拟人的命运。
(上图分别为印尼绿坝娘和我国的绿坝娘)
儿童网络安全的今天,
不仅仅是拒绝色情暴力
如今距离绿坝横空出世已经有十年之久,在从绿坝娘身上取得短暂的胜利之后,我们却发现儿童网络安全的问题要比我们想象中严重的多。
如果说绿坝效果太差是因为技术不到位,那么我们今天的AI技术已经完全足够应对图像和文字的识别。但是今天的儿童网络安全,面临的早已不仅仅是1024或在漂流瓶里丢自己敏感部位照片的怪蜀黍。
近几年以来,儿童网络安全问题有着以下两个明显的变化趋势。
一、 线下问题逐渐向线上转化
以往儿童网络安全只需让未成年人远离色情、暴力等等不当信息,但如今随着互联网普及,很多发生在现实中的问题也开始向线上转移阵地。比如网络霸凌就是一个全球普遍的问题,广州市青年文化宫曾经调查得出,六成受访青少年既是网络霸凌者也是受害者。其他的还有在儿童网游中通过道具诱惑儿童,进行猥亵行为等等。儿童网络安全问题正在越发多样化,很难仅仅依靠识别技术解决。
二、 有害内容形态模糊化和隐秘化
以往的有害内容通常一眼就能被人类识破,但如今的有害内容甚至连家长自己都看不出来。就像前一阵的儿童邪典片一样,借用儿童最常接触的内容潜移默化的传达信息,如果家长不往深处想,可能都不觉得这些内容有些什么不对劲,更何况是AI了。或者像蓝鲸游戏一样,通过微信群、QQ群工具小范围传播组织活动,活动的参与者还会注重信息的保护不向外传播。如何在保护隐私的前提下发现并防止类似状况发生,是目前有待解决的大问题。
不过今天的我们,也在用更新的方式保护儿童网络安全。
首先,我们已经放弃了政府牵头、一套软件全国用这种吃力不讨好的方式。而是当BAT、TMD等等巨头已经收拢了大部分互联网流量时,把压力转移到企业身上,让企业们各施所长进行内容监管。
并且更新的技术手段也在快速进入儿童网络安全保护领域。像美国初创企业Securly就通过云端向中小学提供网络过滤服务,利用NLP识别文字所表达的情绪,当发现儿童青少年的有自杀倾向时及时向父母发短信提醒。
加上相关法律法规走向规范,在净网行动的影响下,成年人都很难找到“不当内容”,更别提孩子们了。
我们或许应该承认,绿坝的初衷是好的、是必要的,甚至在它体现出的些许分级模式出行中,相对给予了成年人一些自由。可惜技术的不到位和民众们强烈的反感,让绿坝和分级模式一同走入了坟墓,我们最终选择了更加粗放的解决方式,将所有触网人群一同保护起来。
但即便如此,不断变化儿童网络安全问题还是没有得到很好的解决。十年之后,仍在起点。