肖楓起了個大早,三個舍友此時還在跟被子做鬥爭,為了避人耳目,肖楓帶著滿腦的想法跑去了圖書館。
圖書館的電子閱覽室在頂樓,肖楓還特地找了個角落頭的視野死角位坐下,這樣就不用擔心操作的時候會被人看到。
圖書館也只有在臨近考試的時候才會人滿為患,此時放眼望去不過寥寥幾人,著實有些冷清。
肖楓用身份ID解鎖了權限登陸到了集團的智庫裡,利用系統可以自動抓取大數據的能力,為自己開發智能軟件提供充足的數據來源。
肖楓打算研發一款陪聊工具,跟市面上的產品不同的是,肖楓采用智能陪聊,全程都是機器人回話。
現有的陪聊業務,一般都是人工服務,服務價格偏貴,而且無法做到24小時在線,顧客很容易深陷其中不能自拔,並且伴隨有一定的道德風險。
而肖楓要做的,一是要把價格壓低到學生都能接受的價格,二來是要把這種潮流推廣出去,讓人們把通過這種方式排解精神壓力當做一種時尚。
既然是全自動操作,免不了要收集大量的數據,不能像聊天工具那樣只是設置簡單的單一回復模板,必須針對相應的內容進行針對性的回復。
肖楓先對抓取數據進行了簡單的篩選,把跟情感無關的話題統統都剔除在外後,得到的依舊是個龐大的蓄水庫。
各種社交工具上每天都會產生大量的圖文,而那些兩性之間的日常對話,則是肖楓關注的重點。
為了博人眼球,網上炮製出來的消息存在著誇大虛假的成分,肖楓沒有全部取信,但也暫時全部采集到了數據庫裡。
並不是所有人都喜歡把跟別人的聊天記錄都貼出來,肖楓也隻好另辟蹊徑——你不給我看,我自己黑進你社交帳號看。
單憑社交帳號的保密級別,在肖楓眼裡跟裸奔沒什麽區別,畢竟肖楓是希爾科大學當屆唯一一個信息工程學博士。
當年在大學的時候,授課教授在課上侃侃而談,他是矽谷的高級安全師,在台上大放厥詞說誰能攻破自己設計的防火牆,誰就可以拿到博士學位。
誰知道剛一下課,教授就發現軟件登陸不進去了,肖楓在課上就攻破了防火牆,還順帶著把保密級別又提升了幾個檔次,弄得教授最後不得不反過來求肖楓給自己開放權限。
可一個個黑效率實在是太低了,一開始肖楓打算黑進社交軟件裡去盜取用戶數據的,後面覺得這樣肯定會引來滿城風雨,還是作罷了。
黑校園網就是個不錯的選擇,雖然數據源可能會少一點,但也能作為甄別互聯網消息真假的參考,而且也比較容易攻克,只要不弄出經濟犯罪,學校一般也不會深究。
因為現在新生還在軍訓的緣故,肖楓隻好安了個定時啟動的程序,生效時間是晚上八點到十二點,逾時自動銷毀。
在程度啟動期間,只要用校園網登陸帳號的用戶,所有消息都會被自動采集進來。
“感覺自己又罪惡了不少。”
肖楓突然覺得四周有點冷,馬上是喝了口咖啡壓壓驚。
開發一個智能系統可不是個簡單的活,更何況研發團隊只有肖楓一人,肖楓打算先進行一個簡單的測試,看看效果能達到什麽樣的程度。
肖楓先試用了下關鍵詞回復,讓系統根據自己問話中的關鍵詞給予相應的回復,這是比較初階的技術,不少社交工具上早已廣泛運用。
“我好冷。”
【多喝熱水】
“我有點餓了。”
【喝多點熱水】
“我好像發燒了。”
【打點熱水喝吧】
“我來那個了。”
【記得喝熱水】
肖楓眼皮子微微顫抖了一下,“額….這是我敲代碼的時候出了問題,還是我采集到數據有問題….”
肖楓移動起鼠標滾輪,先是檢查了下代碼在邏輯運轉上有沒有出現差池,畢竟太久沒敲過了難免有些手生。
檢查的結果無一紕漏,這就表示是自己采集的數據出了問題。
“我的天啊,這到底是什麽情況,為什麽很多關鍵詞的回復都跟熱水有關。”
肖楓百思不得其解,起初還以為是數據裡面混進了一些跟熱水器有關的東西,可篩選結果表示數據的選取范圍也沒有問題。
百般無奈下,只能用最原始的方法了,肖楓開啟了宏查詢功能,在數據庫中搜索起了出現“熱水”一詞的數據源,嘗試著進行人工甄別。
顯示的結果數以億計,肖楓也不可能逐條去看,他只是想發現問題到底出在哪裡。
【我的智障男友,天天只會叫我喝熱水,喝喝喝,喝你MMP】
【男神竟然親手給我打熱水了,暖暖的,好貼心】
【求求你們追女孩子的男生了,喝熱水low爆了】
【喝熱水跟隨便一樣都是敷衍】
肖楓翻閱了幾十條數據源,裡面提及的熱水好像跟自己理解的含義不太一樣,沒任何感情經歷的肖楓顯然不懂其中的奧秘,隻得在那裡自己瞎猜。
“單從看過的數據看,這個“熱水”少說也有五六種意思啊,跟那個“意思”有著異曲同工之妙,漢語真是博大精深啊。”
問題是找到了,肖楓的腦袋也大了起來。
很明顯根據關鍵詞回復的這種初級技術根本無法滿足顧客的需求,肖楓也能聯想到當自己需要一杯咖啡,而對方卻一直給自己遞白開水時的惱人狀態,升級人工智能勢在必行。
“想不到我要把深度學習系統用在這種途徑上面,感覺用偏了地方。”
當今聞名的阿爾法狗采用的也是這種技術,只不過現在這種技術還不屬於普及階段,並不會優先服務於普羅大眾。
用肖楓的話來說:“我用造人造衛星的技術,來賺你們的餐飯錢。”
不過開發出來的系統不必掌握太高級的學習能力,他只要能依據字面上的意思推測出發出者的大致心境,並作出相應的反應即可。
自己編排一套完整的系統沒個十天半個月是行不通的,好在集團有現成的技術框架,肖楓直接拷貝了一份出來加以完善,很快第一代智能陪聊系統就這樣誕生了。
至於系統的代稱,肖楓命名其為mask(假面)
接著又開始了日常測試。
“今天天氣真好。”
【天氣真好,不過太陽有點大,出去玩記得帶傘遮陽哦】
“我好冷”
【不應該啊,現在外面天辣麽熱,你是不是感冒了】
“我想喝咖啡”
【咖啡喝多了對身體不好,還是多喝點熱水吧】
肖楓:“額..算了,這下子回復看起來總算正常了點,勉強算過關吧。”
雖然通過了初步的測試,但值得完善的細節還有很多,現在的系統只有一種模式,而且從回答中可以看出語言的風格差異很大,肖楓覺得很有必要再單獨劃分出來。
高冷的男神、油滑的渣男、花心的高富帥、體貼的暖男、木訥的老實人…..
“嘿呀,我的天,怎麽這就天黑了。”
折騰完系統的工作後,肖楓看了看外面的天色,早就是黑得路都看不清了,沉迷工作一天,三餐都沒有吃,隻喝了三瓶咖啡。
勞模肖楓關閉了電腦,就近找了個飯堂吃宵夜,順帶構思起後續的優化工作。