陈根:算法的开放和狭隘,初衷和进路

发布时间:2020-09-23 相关聚合阅读:

原标题:陈根:算法的开放和狭隘,初衷和进路

文/陈根

相较于传统的物理世界,新一轮信息技术的发展使一个基于互联网、人工智能、大数据、区块链等新兴科技而形成的“数字世界”正真实而具体地嵌入我们的社会生活,深刻又广泛地影响着我们习以为常的现实世界。

但不论是大数据还是人工智能,都依托算法而存在,我们正在走进的数字世界本质上则是数据驱动的算法应用。当算法充斥于我们的生活,又在细微处改变着我们对信息的接收、对产品的需求以及情绪与状态时,却少有人关心算法最终会对我们产生的影响。

事实上,以算法为导向的思维模式,正在迅速地蔓延到自然科学和社会科学的所有领域,并渗透到我们日常生活的各个方面。它将对文化和消费者行为产生巨大影响,而任何人都需要为此做好准备

算法基础和算法前提

一般来说,算法是为解决特定问题而对一定数据进行分析、计算和求解的操作程序。算法,最初仅用来分析简单的、范围较小的问题,输入输出、通用性、可行性、确定性和有穷性等是算法的基本特征。也就是说,算法是一个过程或一组规则,它可以像食谱一样简单,也能够像机器学习程序代码一样复杂

数学是算法的基础之一,而且走得相当艰难。以数学演算为形式的传统算法进化了2000多年,到18世纪才有所飞跃——德国数学家莱布尼茨发明了二进制,还设计出第一台能做加减乘除的机械计算器。

此后200多年,随着高斯函数、概率论、图论、布尔逻辑及更多数学分支的发展,1930年代,二进制电子电路的问世使现代算法呼之欲出。一个叫克劳德·香农的麻省理工研究生试着把二进制和布尔逻辑结合写进电子电路,之后他发现这种结合能解决数学难题,存储数据,编辑图像和文字。

1946年,世界上第一台计算机“埃尼阿克”在美国问世。它重30吨,能用20秒计算出炮弹的轨道。从此,算法走出古典数学家的演算纸,进入计算机时代。

而数据信息则是算法存在的前提。事实上,算法的本质就是对数据信息的获取、占有和处理,在此基础上产生新的数据和信息。简言之,算法是对数据信息或获取的所有知识进行改造和再生产

由于算法擅长计算、数据处理和自动推理,因此,它们也成为当今数据驱动世界中极具价值的工具。于是,我们所做的一切,从吃饭到睡觉,在被数字化地跟踪并生成数据后,算法进一步组织这些非结构化数据并将其加工成模型,以此来获得某种具有预示性的数据结果。

以社交娱乐为例,可以说,社交媒体就由庞然大物般的算法构成。社交媒体根据人们所提供的以及来自其他各种渠道的数据,确定人们的兴趣、爱好、口味,然后推送更多人们喜欢的内容。

其中,“基于内容的推荐算法”和“协同过滤算法”应用最广,也最典型。基于内容的推荐算法在资讯阅读领域有着基石般的存在。形象地说就是“你多看什么就给你推荐什么”。Feed流(信息流)是目前资讯和社交软件最常用的展示方式,因直观、简单、高效等优势深受欢迎。

早期Feed流以Timeline(时间线)排序,最经典的案例就是朋友圈。这种排序法易于理解且充满极简主义。但它的缺点也显而易见,即呈现出效率低下的不良体验。

于是,“重力排序算法”得以衍生,兼顾热度和更新时间的综合策略。它给内容施加两种力:“重力”和“拉力”。前者是时间,新内容会把老内容刷下去。后者则代表点击数、评论、赞等“热度”,又会把热点内容推上去。如此往复,用户将看到一种“既新又热”的动态平衡。

“协同过滤算法”则主要基于人际关系和兴趣关联的推荐方案。值得一提的是,协同过滤最终不是在资讯而是在电商领域发挥了最大价值

“尿布—啤酒”的销售案例就是协同过滤的经典应用。沃尔玛分析消费者购物行为时发现,男性在买婴儿尿片时都会顺手犒劳自己几瓶啤酒。于是,两种看似风马牛的东西,通过大数据和算法,捆绑销售实现效益最大化。

算法的开放和狭隘

不断扩大的算法体系包罗了万象,兴起了数据主义,数据主义(dataism)宣称“宇宙是由数据流组成的,任何现象或实体的价值取决于它对数据处理的贡献”。于是,在数据主义的影响下,所有的社会科学都呈现出追求理论上隐藏在我们的社会经济活动中的算法模式的趋势,就像所有的自然科学都在试图解码自然的有机算法一样。

在“一切都是算法”的理念下,人们越来越相信算法能够让我们得到优化的结果,这进一步增强了数据主义的吸引力。比如,谷歌(Google)和Hopper能够通过设计的算法跟踪和预测机票价格来节省用户的航空旅行费用;Spotify的算法让用户享受发现新音乐的乐趣,或者通过定向广告让人们发现曾经不知道但非常想要的产品。

甚至,算法和机器学习能被应用在疾病诊断和生物特征跟踪中。人工智能(AI)在疾病诊断方面的应用日益普及,有些地方AI甚至可以提出治疗方案和疗法建议。 2020年1月一项研究结果显示,通过X光片子诊断乳癌,算法的表现超过医生。

时下,算法统治着各个领域,从时尚出版娱乐到金融保险旅行等。随着技术的发展,很快,算法就将接管其他关键领域,如交通、城市规划、医疗和教育,所有这些都将对我们的整体生活质量产生深远的影响,而不论其是好是坏

但问题是,当一切都建立在数据的基础上时,随着日常生活中所有领域逐渐被算法接管,无意识但高度智能的算法可能很快就会比我们自己更了解我们,也会诱使我们进入一个算法陷阱:提炼出最大众的标准,呈现出同质化的经验,并以此作为对每个人的最佳选择

历史学家赫拉利表达了这方面的担忧。他指出,大数据比我们最亲近的朋友还要了解我们自己。在医疗领域,大数据不仅知道人们过往的病史,还知道人们祖先的病史,家族的基因情况,以及生活习惯等。因此,在健康方面,相比个体本身,大数据更能做出恰当的决定。

在情感生活领域、职场领域等都存在同样的情况,消费领域自不待言。顾客走到一个货架前,会拿起哪些商品来查看,比较哪几个品牌,最终买下哪件商品,大数据都能做出可靠的预测。

这似乎只是传统消费行为学、社会学的延伸。然而,法兰克福学派却更早就对商业社会的媒介霸权做出了警告和批判,马尔库塞认为,传播媒介中的广告等信息给人们制造出一些虚假的需要,人们并不去思考自己究竟需要什么,而是被媒介信息所操控,沉迷于它们所宣扬的物质世界

于是,个体不再了解自己真正的需要,而是被给予需要,人们的决定并不真正由自己做出。每一个登录亚马逊网站的用户都会看到一个定制的主页,上面满是亚马逊算法根据你的购买历史精心挑选的产品。算法在产品发现方面已经占据了主导地位,但现在它们开始通过自动购物进一步侵蚀消费者的自由意志。

最终,数据主义和算法决策的传播所产生的影响明显地体现出来:它开始剥夺人们的能动性,剥夺了人们做出自由意志选择的机会。

在线搜索中,Google根据人们输入结果的相关性提供按其算法排名的超链接页面,然后通过浏览链接,从中了解更多信息。而随着智能扬声器和语音助理的推广,越来越多的搜索开始通过语音进行。与自然对话的情况一样,语音搜索通常一次只返回一个答案,即算法认为最匹配的结果,因此极大地限制了搜索结果。于是,人们对算法及其对数据的解释越信任,人们就越不可能质疑其作出的决定

显然,算法的应用使得人们更加自愿和主动地让渡自己的自由意志,同时也使得原初意义上的自由意志的决断过程和结果被轻易地暴露出来并更容易地被影响。此外,社会系统将适应算法的存在,广泛依赖算法来决定集体和个体事务。而社会系统的总体改变又将深刻地改变个体的生存方式,进而再一次改变自由意志的内涵。

但无论如何,当算法赋予一枚硬币开放和狭隘两面的同时,我们也需要有更多思考。不要认为眼前的一切都理所当然,不要习以为常,不要丧失对于正确判断的敏锐度,这才是算法时代下的进路。

Copyright© 2015-2020 版权所有