We shape our tools and afterwards our tools shape us. Marshall McLuhan
麥克盧漢說: 我們塑造了工具,反過來工具也在塑造我們。
我本人不反感AI,也相信人工智能會開創(chuàng)一個偉大的時代,但是我們要思考一些東西,至少知道那是什么。本人旨在讓你了解當前人工智能應用最普遍的智能推薦引擎(Intelligent Recommendation Engine),其背后的設計理念,以及一些更深度的思考。關于理念,它不像技術要求太多的基礎,我盡量不使用專業(yè)術語,所以本文同樣適合程序員以外群體。
從 分類 說起以大家熟悉的分類信息網(wǎng)為例,像58同城、趕集網(wǎng)。網(wǎng)站把現(xiàn)實生活中的商品、服務進行分類進行展示,比如房產、二手車、家政服務等。這些內容即是現(xiàn)實世界對應的抽象,我們可以很容易的找到對應關系。
我們再以求職網(wǎng)站為例,像智聯(lián)招聘、BOSS直聘。網(wǎng)站按照職業(yè)把 人分類,比如程序員、廚師、設計師、數(shù)學家、物理學家等。
那么現(xiàn)在問題出現(xiàn)了,眾所周知,人工智能的完美入門人才是具有數(shù)學和計算機雙學位的碩士以上學歷人才。那么,我們如何把這樣的人分類呢?我們無法單一的將其歸入到程序員或者數(shù)學家,我們無法為每一個這樣的復合型人(slash)進行單獨分類。
分類產生矛盾。
我們區(qū)分南方人、北方人,所以有地域歧視。我們區(qū)分亞洲人、歐洲人,所以有種族歧視。 分類 只是人類簡化問題邏輯的手段,薛定諤的貓和羅素的理發(fā)師已經證明了 分類 并不正確。所以在大計算時代,我們引入 貼標簽 的概念。
AI時代是計算能力爆炸增長所帶來的。在強大的計算能力面前,我們真的可以針對每個人進行 分類 ,它的表現(xiàn)形式就是 貼標簽。
30歲以下、程序員、屌絲、奶爸、熬夜、不愛運動、公眾號叫caiyongji、格子襯衫、機械鍵盤、牛仔褲 這些可以是一個程序員的標簽。換個角度, 類別 反轉過來服務于單獨的某個人,這是在計算能力短缺的時代所無法想象的。
傳統(tǒng)的智能推薦引擎對用戶進行多維度的數(shù)據(jù)采集、數(shù)據(jù)過濾、數(shù)據(jù)分析,然后建模,而人工智能時代的推薦引擎在建立模型步驟中加入Training the models(訓練、測試、驗證)。
最后,推薦引擎就可以根據(jù)用戶標簽的權重(可以理解為對標簽的打分,表示側重點),對用戶進行精準推送了。
推薦引擎屬性分化俗話是這么說的 旱的旱死,澇的澇死 , 飽漢子不知餓漢子饑 ,不知道這些俗語我用的恰當不恰當。我的意思是在智能引擎的推薦下,會加強屬性兩極分化。
我們以程序員為例,選取編程技巧、打游戲、體育運動、熬夜、看書五個維度。經過推薦引擎的 塑造 后如下。
目前,推薦引擎的算法會將權重比較大的標簽進行優(yōu)先推廣,這就導致原本權重大的標簽得到更多的曝光次數(shù),最終使得權重大的標簽權重越來越大,而權重小的標簽在長時間的被忽略狀態(tài)下逐漸趨近于零。
推薦引擎行為引導波茲曼認為,媒體能夠以一種隱蔽卻強大的暗示力量來 定義現(xiàn)實世界 。其中媒體的形式極為重要,因為特定的形式會偏好某種特殊的內容,最終會塑造整個文化的特征。這就是所謂 媒體即隱喻 的主要涵義。
由于 推薦 機制的屬性分化,那些高技術含量的、專業(yè)的、科學的、真正對人又幫助的信息被更少的人接觸,而那些簡單的、輕松的、娛樂的、裸露的、粗俗的信息被越來越多的人接觸。
我們看一下具有影響力的百度、今日頭條和微博在今天(2018年1月13日10:04:xx)所推薦的內容。我刪除了cookie,使用匿名session,移除我的 標簽 。也就是說,下圖所推薦內容對大部分人適用。
只要你好奇點擊,你的tittytainment(我翻譯成 愚樂 ,那個三俗的譯法不要再傳了)屬性權重就會越來越大。娛樂新聞點擊過百萬,科普文章點擊不過百,這種現(xiàn)象正是推薦引擎的行為引導導致的。
不客氣的說,百度、今日頭條、微博對國民素質的影響是有責任的。
無關推薦(Non Relational Recommendation)對于你從來都沒思考過的事物,你可能永遠都接觸不到,因為你不知道求索的路徑,所以有的人每個月都讀與自己專業(yè)無關的書,來擴展自己的知識面。我們舉個例子:
你可能會在網(wǎng)上搜索如何與女朋友和諧相處但你未必會搜索如何讓女朋友們和諧相處,有人笑談 貧窮限制了我的想象力 ,其實不然,是你接收不到無關的推薦,你才被限制在特定的知識圈子里。
所以我提出無關推薦這個概念。
對程序員進行畫像:
如圖,當某個標簽沒有到達 程序員 的路徑時,他可能永遠無法觸及那個標簽。這時,我們推薦 無關 信息給用戶,強制產生路徑。
你可能會質疑,這是隨機強制推薦垃圾信息嗎?
其實不然,通過深度學習,我們可以進行大量的數(shù)據(jù)收集、數(shù)據(jù)分析和模型訓練,我們是可以找到對某個個體無關,但會讓其感興趣信息的興趣點。這種信息就是無關推薦的解。
最后
你每天接收到的 推薦 背后是各個團隊經過心理學研究、行為學研究、大量計算設計的,人們正在失去深度思考、自主判斷的能力。對于進步青年、斜杠青年請保持思考。謹以此文獻給希望進步的你,希望你有所收獲和思考。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領域產品研發(fā)生產超五類,六類,七類線,屏蔽模塊,配線架及相關模塊配件的研發(fā)和生產。
?2016-2019寧波科博通信技術有限公司版權所有浙ICP備16026074號