先講結論,我正式畢業、正式登出臺大,剛拿到熱騰騰的畢業證書。
行人寥寥,樹影搖曳,再次回首臺大校園,感懷流年似水,六年時光就在聲息中飛速而過了。今天終於拿到畢業證書,心中才較為踏實了。這年來為了學業奔走,日夜孜矻,莫敢自遑。不能說有多少智識上的長進,但收穫頗豐,學術上的產出和軼事趣聞,讓人感到美麗而安穩。是較人虛長幾歲,但也不算白費。
·
真的很幸運,能在二十三歲的尾巴拿到第四個臺大學位、第二個臺大碩士,要談客家精神,大概已經發揮極致,畢竟只繳兩份學費。過程就像買菜送蔥,知識也讓人恬淡、平靜、滿足。除了份內的事,我也和師長同學有些著作,目前期刊一篇、研討會三篇,至於努力中的還有兩三個。回首過往,至少不是混過來的,但求心安理得。
·
不過,這些年來也遇到許多困難險阻,但幸有貴人相助,我銘感五內。雖然研究所雙主修制度推出三載,所辦、研教組和圖書館卻沒有預期到有人可以在制度內達標,從學分認定、畢業考試申請,到論文繳交,都是經過密切聯繫,想出解決方案。他們替我排除萬難,我點滴在心。剛從研教組職員手中慎重地接過證書,「你是臺大第一個喔,恭喜。」比起頭銜和證書本身,以經驗譜寫歷史,參與制度臻善,其實更令人滿足自信。希望後繼的學生,走的比我順利、比我安穩。
·
負笈臺北六年,誠要感謝爺奶父母及親族照拂,舅舅舅媽安置,讓我毫無後顧。倘若有聲名、有令譽,我要將一切獻于爾等。研究所兩年,我非常感謝恩師宏浩的知遇,他嚴格正直、真誠自然,不吝給予指教,我學到很多,是我大學四年所遠遠不及。此外我在師門也悠遊自在,老師除了指教,也願意給我各種支持和關照,讓我見名於共著期刊,首現SCI是莫大的榮典,我不勝感激,師恩難報。還有朋友、同學及愛人在精神上的扶助,同樣也是莫大的鼓舞,我亦是心懷感謝。
·
最近修論文煩躁,偶爾看奧運消息,令人振奮,國人無不為之喝采,選手的沈澱與積累,著實不易。但比起能夠分高下、競輸贏的場合,學術生活可能就沒法那麼熱血,甚至還有些枯燥。宏浩師曾經跟我說,學術做得好,你越要忍受孤寂。到頭來能跟你聊上話的,可能真沒幾個。相較萬眾矚目的威武,學術的競逐更像燃燒自己、創造知識,在幽冥中護持青燈,於黑暗裏匍匐前行。這種使命感無法獲得普羅大眾的共鳴,但於自我成就上,同樣具有豐富的建設性,精神已然十分富足。因此,看奧運也成為另一種鏡射,使我鞭策自勵。很高興在東奧結束前,碩士生涯也告一段落,不過研究生涯卻不會因此中輟。很喜歡做實證,不只因為實證可以玩玩資料、代代模型。實證是用積極的方法,做入世的研究。
·
記得天津南開大學的一段掌故,校長張伯苓找經濟系主任何廉辯論,他詰問何廉:「為什麼要建立這些商品的價格指數?你可以了解什麼?」何認為,透過價格指數的建構,有助於中國的科學建設。張伯苓卻批評,這樣的做法無疑是「用顯微鏡找大象」。在張的語境下是批評,我卻認為,「用顯微鏡找大象」就是學術的精神、學術的態度。用嚴謹細膩的方法,去探究看似無疑的問題。胡先生說「做學問要在不疑處有疑」大抵如是。更況民生商品是一個入世問題,要了解中國百業趨勢,價格指數扮演相當關鍵的角色。
·
會談這個故事,其實與我的論文有關,做的是農地價格指數。我與老師協力,利用配對法和Lasso,共同提出一個建構農地價格指數的新方法。農地價格指數在臺灣鮮有所見,我們的研究在方法上也解決了選樣偏差、特徵眾多所造成的多重共線性等等。在農地方面,無疑是大的斬獲、好的貢獻。我國歷來重農桑,面對這樣的問題,我們慎重地、小心地回答了。能夠參與如此神聖的事,我戒慎、感激而滿足。
·
當然,並非所有研究都順遂可期,而學術的過程中本身就充滿痛苦。這幾年來,我很能感同深受。但「學術溺水」實難透過求助收效,我唯一意識到的是,只有自己能夠真正幫助自己。直言之,自我排遣是研究生生活中的要事。雖然領域是計量經濟,文本中矩陣、算式、表格遠多於情感豐沛的文字,但人文的精神不能偏廢。我很感激,在這段時間裡,董橋小品相伴,陳之藩和周作人的散文也在一旁,高陽小說引人入勝,他們為我注入精神活水,是沛然莫之能禦的。此外,有珍饈美酒左右,也令人飽滿幸福。林語堂喜歡吃香港鏞記燒鵝,甚至為他題寫菜單。胡適熱愛馬丁尼,他有自己的秘方。老民國的金絲眼鏡高高穩穩地架在鼻翼上,一身鐵灰白柳西裝,案前不放筆墨紙硯,而是佳餚一桌瓊漿一壺,處處顯露學者的講究、學者的體面。我也好吃,愛肥前屋、吃麵屋武藏,享用浙菜必點韭黃鱔糊,點心要福州芋泥和布朗尼。偶爾也下廚,烹角煮、燒獅子頭,雖然無關學術,卻同樣在漫長的征途裏平添不少逸趣。
·
我真的很幸運,自己境遇好、運氣好,讀書可以讀的多,朋友交的雅。早歲得公器得頭銜,活到24歲還算不賴。董橋自謙坐穩一個又一個位子,那是僥倖,不是才情。不過董公是真實力,而我的情況大抵如前。最重要還是感謝所有協助我的親族師長、同僚與友朋,我永矢弗諼,只是暫時無以報厚恩,人生旅途再慢慢償還。
·
至於未來的規劃,可能先遷西湖鴨母嶺,安頓一番。承蒙恩師垂愛,我會續任研究助理,繼續完成未竟的研究。沒意外的話年底會先做兵,其他的事可能就走走看看。疫情可怖,卻也留給我時間想想,可能也不全然壞事。早歲許身公共事務,後來才漸漸覺得底子太薄、本領太小,政治工作是需要精密的計算而非算計。大衛伊斯頓對於政治的定義是社會價值的權威分配,如果不先學好計量、學好數學,其實也是忝居所司,令人惴慄。不過,學優才有資格分配,這是橫亙中外之理。薩伊德把知識分子刻畫的很清晰,他不斷強調知識份子的應該具有「良知」,也要和權威對抗,致使知識份子具有邊緣性。這種想法實與傳統相若,政治是推己及人,大概就是「君子不匱,永錫爾類」。無論身在何處,都要精進智識、懷抱溫柔,繼續影響周遭的人,這是我時刻提醒自己的。此一矜持,近來歲月格外受用。我的研究生生涯就要告一段落,黨代表也面臨卸任,由衷希求於此之際,同大家共勉。
·
最後,疫情當前,首要是多保重自己,願神恩能永顧,祈使體膚長健,萬事安康。謹守防疫規定之外,也別忘了幽默感,偶而逾矩的言詞、煽情的畫面也非不可,不要悶壞氣壞才好。話說多了,再講下去,可能要比我論文篇幅還長。總之我們還會再會,願在追求真知的道路上相遇,成為照耀幽暗的微明,繼續邁步,奮力前行。
·
歲在辛丑孟秋
筆于福州山麓
工作特徵模型申論 在 李開復 Kai-Fu Lee Facebook 的最佳解答
DeeCamp2020結束了,特別驚喜地看到同學們今年的作品,跟以往線下合作在水準上基本沒有區別。今天的活動評選出了兩個總冠軍獎項,但學生們做的每一個作品都非常優秀、用心。也希望參與的200多名學生有真正的收穫。
本文來自創新工場微信公眾號
………………………………
創新工場DeeCamp2020完美落幕,兩團隊並列總冠軍獎金翻倍,共克真實世界難題
過去的2個月裡,200餘名來自全球高校的學生,聆聽了李開復、張亞勤、吳恩達、張宏江、俞敏洪、周志華等12位AI學術界、產業界大師授課,透徹理解了科技與創投核心規律;分組挑戰開放命題AI創新大賽,用AI和創意向現在和未來人類世界面臨的真實難題問題發起挑戰。
2020年8月5日,DeeCamp2020人工智慧訓練營總冠軍答辯暨結營典禮,在創新工場北京總部隆重舉行。
經過節奏緊湊的立項、研發、測試,DeeCamp 2020開放命題AI創新大賽共37支團隊提交了振奮人心的AI Demo,其中6項入圍總冠軍答辯。他們現場展示了自己精彩的成果,角逐開放命題AI創新大賽的總冠軍和各賽道冠軍。
最終,兩支團隊並列奪得總冠軍,分屬自動駕駛賽道和創新賽道。總冠軍獎金翻倍,兩支隊伍各獲得10萬元獎勵,其餘五個項目獲得各賽道冠軍。
DeeCamp人工智慧訓練營是一項面向全球大學生的公益項目,專注培養應用型AI人才。自2017年暑期啟動以來已舉辦四屆,培養了上千名大學生。DeeCamp 2020 由創新工場聯合華為共同推出,在今年全球變局與挑戰的背景下,旨在召集科技領軍新人才,肩負時代新使命,用AI解決真實世界的難題。受蔓延全球的新冠疫情影響,DeeCamp2020大師課和開放命題AI創新大賽全部轉為線上進行。
創新工場董事長兼CEO李開復博士,創新工場人工智慧工程院執行院長王詠剛,創新工場運營合夥人黃蕙雯,華為雲首席戰略官餘虎,聯合國開發計畫署駐華代表白雅婷(Beate Trankmann),路孚特(中國)科技有限公司董事長兼總經理党曉青等嘉賓出席典禮現場,予以專案點評,並為優勝隊伍頒獎。
華為雲首席戰略官餘虎表示:“華為一貫非常注重AI人才的培養,我們在2018年就發布了沃土人才培養計劃;通過華為雲線上的ModelArts AI訓練平台,以及端側的Hilens kit等算力平台,在高校,跟學校一起,聯合開展教材設計,課程設計;並且舉行無人車大賽,聯合創新創業及科研合作。目前已經和超過50所雙一流高校,形成了良好的合作,培養了上萬名學生。這次華為雲ModelArts平台很好支撐了創新工場DeeCamp大賽,幫助全國各地參賽學生隊伍的實戰項目挑戰AI難題。大家的作品和創意都非常好。期望後面大家能基於本次大賽作為良好開端,更好的掌握AI技能,發揮想像力,基於AI工程化落地的視角,用AI解決真實的產業和生活難題,給社會和生活帶來更多的改變。”
聯合國開發計劃署駐華代表白雅婷表示:“人工智能以及其他新興技術的發展會改變我們的生活,甚至可以為氣候變暖、新冠肺炎等全球性問題提供解決方案,然而它們也會擴大數字鴻溝並造成新的不平等現象。希望各位學員在日後的研究中可以運用所學,促進變革,通過自己的努力為人類創造更可持續的未來。”
路孚特(中國)科技有限公司董事長兼總經理黨曉青表示:“從2019年開始,路孚特成為DeeCamp合作夥伴,為學員分享金融行業深厚的業務知識和豐富的專業數據,並提供學習並實踐相關課題的資源。作為路孚特戰略研發運營中心之一,北京研發運營中心希望能夠吸引國內優秀的AI專業人才,增強AI專業人才儲備和研發技術能力。”
▌6支 AI Demo競逐總決賽,兩支並列總冠軍,10萬獎金翻倍
DeeCamp2020入圍總冠軍答辯的6支項目團隊,分別來自創新賽道、自動駕駛賽道、教育賽道、醫療與公共衛生賽道、商業賽道。8月5日上午,通過雲端連線的方式,6支團隊各自展示了激動人心的Demo作品。
經過評委打分、討論,自動駕駛賽道的Faster&Better團隊和創新賽道的方仔照相館團隊,最終共同奪得總冠軍。總冠軍獎金翻倍,兩個團隊分別獲得10萬元獎勵。另有五個項目獲得了各賽道冠軍。
為什麼最終選出兩個冠軍?評委之一、創新工場董事長兼CEO李開復博士解釋說,這兩個項目評委打分相同,難分伯仲。“Faster&Better”團隊的技術讓人震撼,這說明在今天,黑科技創業的空間仍然存在。而“方仔照相館”團隊則以商業取勝,讓我們驚訝於積木居然可以與AI結合。他們的“方頭仔”產品讓人充滿購買欲望,幾乎是一項可以直接拿到融資的項目。“我們認為這兩個組,任何一個單獨奪冠,都不能完整表達DeeCamp代表的精神,所以最終決定評選出兩個總冠軍。”
▍總冠軍:方仔照相館 BrickMeStudio
所屬賽道:人工智慧的創新思考與前沿設計
挑戰賽題:自動積木建模
AI+積木?聽起來如此跨界的兩件事,會有什麼奇妙的組合?
來自北京航空航太大學、清華大學、香港中文大學、奧地利科學技術研究所的同學們組成的“方仔照相館”團隊,用AI玩轉積木,為創意插上了翅膀。
他們打造了一個AI積木創作平臺“方仔照相館”,簡單上傳一張頭像照片,就可以生成個性化定制的方頭仔玩偶頭像。未來,只需一鍵下單,百變趣味的方頭仔就可以郵送到家。
怎麼實現呢?他們先根據輸入的圖像,抽取特徵向量,比如髮型、劉海、鬍子、眼睛、下巴、膚色、上衣款式、衣服圖案、鞋子顏色、手的擺放、褲子紋理等,匹配相應的積木零件,然後生成積木模型和拼裝步驟。
“方仔照相館”團隊希望將自己對積木的熱情,傳遞給更多人。積木不只是孩子們的玩具,更是創造力的源泉,“AI時代,更要注重創造力培養”。
▍總冠軍:Faster&Better
所屬賽道:自動駕駛的技術突破與前沿設計
挑戰賽題:算符算力約束下的無人駕駛車輛檢測
自動駕駛是人工智慧中最具挑戰、最具有應用前景的方向之一。對於需要大規模落地量產的車輛檢測場景,神經網路模型只能在較為廉價的晶片上運行,這為檢測模型的效率帶來了巨大挑戰和約束。
Faster&Better團隊在滿足嚴格算符算力的約束下,設計了一種極為高效的anchor-free車輛檢測模型。該模型採用了backbone、後處理策略,將物體看作點,使用輕量的head來預測物體位置、類別和bounding box,在保障性能的同時大幅提升了速度。
Faster&Better團隊對項目的商業價值也進行了思考。該車輛檢測模型能夠很容易地部署在低成本的晶片上,實現產品的落地,帶來商業回報。模型反覆運算速度快,可以使用更低的功耗訓練和維護。模型精度高,能夠為無人系統的安全性和穩定性保駕護航。
未來,該車輛檢測模型也有廣闊的應用空間。一是可以部署到行車記錄儀等傳統硬體上,使其智慧化,具備行車預警功能;二是可以部署到安防監控中,使用模型自動過濾篩選,將視頻中有車輛的場景加以保存,節省存儲空間,也節省人員重播視頻的時間。
▍教育賽道冠軍:Teched U
所屬賽道:用AI驅動的教育新工具和新方法
挑戰賽題:網路公開課聚類、檢索、評價和推薦工具
線上教育是未來趨勢,但錄播課的用戶體驗不佳。大量的錄播課僅將一段長視頻從線下直接搬運到線上,難以避免冗餘重複,造成學生積極性差、完課率低等問題。
來自卡內基梅隆大學和沃頓商學院的同學組成了Teched U團隊,希望用AI技術賦能線上教育。他們通過自研原創神經網路 TopicNet,實現長視頻切割、大綱提取、知識搜索三項功能。
通過視頻切割,尋找知識結構中斷點,可以將一小時的教育視頻切割成5-10分鐘的短視頻,讓使用者利用碎片化時間學習;通過大綱提取,借助整理好的知識大綱進行跳轉,讓使用者快速瞭解知識內容的結構;通過知識搜索,可以精確尋找到相關視頻和精確到秒的視頻跳轉位置。
目前,線上教育巨頭主要通過人工標注做視頻切分,但對於缺乏人才和技術的中小型線上公司,這項低成本的視頻切割自動標注技術,可以説明他們豐富視頻內容,實現精准推薦,從而提升用戶體驗和轉化率。
▍醫療賽道冠軍:心靈捕手
所屬賽道:用AI應對醫療和公共衛生領域的新挑戰
挑戰賽題:通過深度學習識別生物電信號
在DeeCamp,AI+醫療也可以大顯身手!
由“心靈捕手”小組帶來的“聽醫聲AI 診斷專家”項目,是本屆DeeCamp項目中唯一一個軟硬結合的項目。硬體製作、小程式設計開發等工作,全部是在DeeCamp期間用兩個月的時間完成。
“聽醫聲”AI診斷專家通過電子聽診器採集心音、呼吸音、脈搏,並將電子化的信號傳遞給微信小程式及後臺雲端分析系統,進行定量分析判斷使用者的健康狀況,實現健康監護、疾病預警、輔助診斷。若檢測到身體異樣,可自動推薦附近的醫院。未來,“聽醫聲”既可以輔助醫生做疾病早期篩查、健康監測,也可以用在留守老人監護、殘疾人健康關愛等領域。
值得一提的是,“聽醫聲”的脈搏波資料集,通過與醫院、診所、體檢中心等工作單位合作,共採集了6000余例由中醫專家標定的脈象資料,把專家經驗轉化為臨床診斷量化標準,實現了中醫問診的客觀化、資訊化。
▍創新賽道冠軍:AI科幻世界
所屬賽道:人工智慧的創新思考與前沿設計
挑戰賽題:科幻小說自動/輔助生成
你能想像一個AI構建的科幻世界嗎?在DeeCamp2020,AI正在創造一個全新的寫作時代。
來自中科院、美國喬治梅森大學等高校的五位同學組成的“AI科幻世界”團隊,基於Open AI 的GPT-2模型,在百億級中文大規模語料上重新訓練,打造了一位神奇的“AI科幻小說作家”。
這位元“科幻作家”,可以根據設定好的故事主線、人物角色等,互動式生成科幻小說內容,不僅可以遣詞造句,還可以創作構思,讓普通人也可以化身“科幻文學大咖”。
“AI科幻世界”團隊在開發的過程中,借鑒作家創作小說的過程,受到認知心理學和文學理論啟發,提出情節大綱主導的、人機協同寫作的範式:用戶輸入第一句,機器輸出多個人稱一致、語句連貫、邏輯合理的下一句話候選,由用戶做篩選和修改,不斷重複形成情節閉環。
在人機協同的半自動模式下,AI科幻世界寫作故事大綱的速度每分鐘可達50-100字。而在無人干預的全自動模式下,可以在1秒鐘之內寫出一個曲折動人的兩千字故事,揭開了創作的神秘面紗。
未來,科幻小說自動/輔助生成可以應用在商業傳播場景中,提升內容的廣度和個性化,兼顧精准分發下的使用者需求和內容品質,滿足企業對海量資訊的搜集、分析、篩選、整理和發佈需求。
▍商業賽道冠軍:“Non-pretrain”
所屬賽道:AI 賦能的商業決策與商業流程優化
挑戰賽題:人工智慧在量化交易和投資中的決策輔助
量化交易是指以先進的數學模型替代人為的主觀判斷,利用電腦技術從龐大的歷史資料中海選能帶來超額收益的多種“大概率”事件以制定策略。
來自南京大學、復旦大學的“Non-pretrain”團隊,針對外匯量化交易的歷史資料,提出了一種資料依賴的相似性度量方法。對每一個分類,分別使用所提出的層次注意力LSTM模型對未來匯率進行預測。最後對多個類的預測結果進行集成,並結合挖掘出來的典型pattern制定交易策略。
此外,聯合國開發計畫署一直非常關注高新科技與人工智慧在可持續發展領域的應用,為了鼓勵各位學員積極探索用AI解決可持續發展問題,專門設立了“AI4SDG”獎項,頒發給西天取經團隊、AI倒爺團隊、Teched U團隊、Brainnova意念互聯團隊、心靈捕手團隊。
此外,DeeCamp還組織了學員互評,評選最受學員歡迎的作品,最終西天取經、You OnlyLook Us、AI科幻世界三個團隊獲此殊榮。
▍自動駕駛賽道冠軍:“西天取經”AwesomeDet
所屬賽道:自動駕駛的技術突破與前沿設計
挑戰賽題:算符算力約束下的無人駕駛車輛檢測
西天取經團隊由來自北理工、北航、新加坡國立、北大、麥吉爾大學的五位極客組成。他們希望在自動駕駛的漫漫長路上,經歷磨難,不斷成長探索。
團隊採用了業界先進的技術,從Backbone、Neck、Loss三個層面出發,設計了一系列滿足算符算符約束的目標檢測模型,並做出適配改進,進行算法針對性優化。
推理速度是衡量自動駕駛技術的關鍵指標,目前行業內對推理速度的最低要求是10fps, 而該團隊的產品推理速度最快達到了74.5fps。
同時,他們提出了基於數據分析提出特定的增強方法,改善了夜間難樣本的訓練。經過真實場景下的測試,無論側視、後視、前視、夜景,都表現出了良好的遷移效果,測速、性能表現較好,達到了簡單場景下的車輛檢測要求,滿足了商業落地的要求。
該項目另外一大亮點是在手機上集成了檢測產品,做到了產品級別的實時呈現。未來,產品將可以搭載到智能行車記錄儀車輛預警、車載手機預警APP、交通事故實時監測、實時治安情況監測等多個領域。
此外,聯合國開發計劃署(UNDP)一直非常關注高新科技與人工智能在可持續發展領域的應用,為了鼓勵各位學員積極探索用AI解決可持續發展問題,專門設立了“AI4SDG”獎項,頒發給西天取經團隊、AI倒爺團隊、Teched U團隊、Brainnova意念互聯團隊、心靈捕手團隊。
▌74所高校200余名學生參與,12位大師授課
DeeCamp2020採用開放報名+定向邀請的方式,通過激烈競爭,200余位學員最終入選。
他們來自清華大學、北京大學、中國科學院大學、南京大學、北京航空航太大學、復旦大學、中國人民大學等44所國內高校,以及卡內基梅隆大學、麻省理工學院、牛津大學、康奈爾大學等30所海外高校,分佈在86個國內城市及北美和歐洲的17個海外城市。
學員中,碩士生占比56%,本科生占比26%,博士生占比17%。另外還有1%的學員是優秀的高中生,他們的技術科研能力已經達到了大學本科生的水準。
DeeCamp2020獨創“大師課+開放命題AI創新大賽”模式,讓學員既可以近距離與科研及產業領域大師溝通交流,也可以與志同道合的小夥伴結隊,親身體驗 AI 技術如何轉化為產業應用、積累實踐案例經驗。
在大師課上,李開復、張亞勤、吳恩達、張宏江、俞敏洪、周志華等12位來自AI領域學術界、產業界的重量級嘉賓,為同學們分享了AI前沿理論、產業創新、行業發展、創業趨勢等領域的最新洞察,讓大家充分領略了學術大師的思維方式,感受知識的魅力。
不同於常見的 AI 領域競賽,DeeCamp2020 開放命題AI創新大賽不以完成某一具體指標為目的,而是讓同學們組隊完成一個完整的創新項目,鼓勵其用創意向現在和未來人類面臨的科技問題發起挑戰。
因此,在賽題的設置上,DeeCamp聚焦社會熱點,關注真實世界與人們生活,共設置五大賽道14個新穎賽題,允許學生自由組隊。五個賽道分別是:
•教育賽道:AI 驅動的教育新工具和新方法
•醫療賽道:用 AI 應對醫療和公共衛生領域的新挑戰
•創新賽道:人工智慧的創新思考與前沿設計
•商業賽道:AI 賦能的商業決策與商業流程優化
•自動駕駛賽道:自動駕駛的技術突破與前沿創新
據創新工場人工智慧工程院執行院長王詠剛介紹,這次的賽道賽題設計具有“更熱門”、“更真實”、“更接地氣”三大特點:
“更熱門”:2020年是特殊的一年,我們面對著最多的變化,最多的挑戰,也是最多的機會,因此賽題設置貼合當前社會最關注的熱點問題,如健康賽道關注仍在全球延燒的新冠疫情。
“更真實”:為了讓同學們最大限度地接觸真實世界,所有賽題提供的資料都來自各個合作企業的真實場景資料。例如在Momenta提供的自動駕駛賽道中,Momenta為同學們提供了一批獨家未公開的128線雷射雷達檢測資料集和十萬量級視覺資料集,希望同學們在科研人員帶領下一同解決行業中的各類技術問題。
“更接地氣”:賽題設置與同學們的學習生活息息相關。在教育賽道中,人工智慧對程式設計教育的應用占了很大的部分,因為參賽的同學大多來自數學、電腦專業,有自學程式設計的經歷,這能促使參加該賽題的同學發揮主觀能動性,更好的利用自身經驗提高項目完成品質。
最終,共有9支隊伍選擇了商業賽道,10支隊伍選擇了自動駕駛賽道,5支隊伍選擇了教育賽道,6支隊伍選擇了醫療賽道,7支隊伍選擇了創新賽道,向這些難題發起挑戰。
▌你想用AI改變什麼?——DeeCamp學員的AI願望
人工智慧是一項偉大的技術,我們有幸生活在這個時代,也應該努力讓人工智慧造福人類社會。
“你想用AI改變什麼?”在主辦方發起的一項徵集活動中,200多名同學用紙和筆,寫下了自己的AI願望:
o“我想用AI改變人們的出行方式”
o“我希望用AI改變人們的教育環境,為所有人帶來更加智慧化的教育方式”
o“我希望用AI解決量化投資及商業決策問題”
o“我想用AI改變遊戲設計”
o“我想用AI改變文學作品的表現方式,讓大家能更加淋漓盡致地表現所思所想”
o“我想用AI改變醫療診斷技術”
o“我想用AI改變我們觀察世界的方式”
………
創新工場人工智慧工程院執行院長王詠剛表示,DeeCamp是一個為學生服務、充分發揮學生自主精神的人工智慧訓練營,鼓勵所有來到DeeCamp的同學進行一段自我驅動的AI學習實踐之旅。
在專案期間,DeeCamp的同學們充分發揮了“自我組織、自我管理、自我表現”的精神:自發組織了13場分享會,涉及創業經驗、讀書感想、技術研討、項目交流。在官方組織的“飯?泛?FUN?”談會中,學員們積極與各位大師雲上約飯,探討AI產業發展、創業方向、職業選擇等話題。
DeeCamp人工智慧訓練營自誕生起,就以消弭中國AI應用人才鴻溝、培養和完善中國AI應用人才生態為初衷,堅持公益屬性,將知識課程與項目實踐相結合,引導學生體驗 AI 技術如何轉化為產業應用,積累實踐案例經驗。
自2017年暑期首次開辦以來,DeeCamp總計收到來全球 1000 餘所高校超過 20000 份報名申請,已有 1000 余名學員順利結業。
DeeCamp的最大期待,就是結業的學員們都能在方興未艾的 AI 產業浪潮中,真正解決來自真實世界的難題,將論文中的 AI 演算法打造成一個個成功的 AI 產品與解決方案,用AI創造更美好的人類未來!
未來,DeeCamp 將繼續砥礪前行,不遺餘力地在人工智慧人才培養上面挖掘新方法和新思路,為 AI 領域輸送最新鮮的血液、提供最堅實的力量。
工作特徵模型申論 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
為了活下去,全球最大的零售商沃爾瑪變身數據公司
文:王茜穎 / 若水 Flow AI Blog 編輯團隊
【本文重點】:
1. 今天,人工智慧不再是一種選擇,而是生存下去的基本必須品。
2. 為了預測消費趨勢、提高供應鏈和營運效率,沃爾瑪張開數據網,即時監控2000億筆的內部交易數據,200 個外部數據。
3. 從行銷、採購、品管、上架、庫存管理到配送,AI 正在改寫超市地景和運作方式。
零售業是一個國家最古老的行業。但你發現了嗎?全球最大的零售業龍頭沃爾瑪 Walmart,正在把自己變成一家數據公司。
它不得不。它最大的競爭對手,吃下線上零售市場一半江山的電商龍頭亞馬遜,不斷探索線下經營。繼實體書店、無人便利店 Amazon Go、收購全食超市(Whole Foods Market)之後,2019年再度推出 Amazon 4-star,銷售在亞馬遜網站上獲得4顆星以上評價的商品,準備對線下零售市場攻城掠地。
「今天,人工智慧不再是一種選擇,而是生存下去的基本必須品。」知名暢銷作家Bernard Marr 說。《華爾街日報》形容這是一場「不斷升級的科技地面戰」。
如何確保對的產品在對的時機,放在對的位置,做出對的定價,以方便對的人購買,是競爭白熱化的零售業的致勝關鍵。
即時監控2000億筆的內部交易數據,200個外部數據
為了抓出客戶需求、提高供應鏈和營運效率,沃爾瑪阿肯色州本頓維的總部設立了@WalmartLabs 和 Data Café(Collaborative Analytics Facilities for Enterprise,企業協作分析工具),監控過去幾週高達2000億筆的內部交易數據,以及氣象、經濟、電信、社交媒體、油價、鄰近沃爾瑪的重大事件(如:體育賽事)、美國最大評論網站Yelp、信用徵信網站Experian等200個外部數據。
沃爾瑪每週預測全美4700家店,共500億件商品需求,「我們每個週末都提出一套新的預測,」「我們有12小時完成所有的預測,約3天完成所有的訓練。」@WalmartLabs 傑出數據科學家和數據科學主任John Bowman說。
但沃爾瑪的規模實在太大了,Bowman說原有的開源軟體,「隨著我們擴大演算法規模,加入愈來愈多的數據,涵蓋愈來愈多的類別,開始遇到嚴重問題」,目前其預測模型是由內部改寫和開發的機器學習演算法組成,每項商品的預測,都建立在350個數據特徵上。
除了預測消費風向,最基本的,「用來確保門市和配送中心的庫存水位,足以滿足預測的需求。它不只幫沃爾瑪控制庫存成本,也確保架上的庫存足以應付來客或網路訂單。」前@WalmartLabs印度班加羅爾主任Nitin Sareen指出。
沃爾瑪 Walmart 同時收集所有顧客的消費紀錄、住在哪裡、並從店內的免費無線網路追蹤其產品喜好。2017年的報導指出,沃爾瑪掌握了6成美國成人,近1.45億人口的詳細資料。「我們想知道世界上所有的產品,我們想瞭解世界上每一個人,然後我們想要擁有連結兩者,促成交易的能力。」前沃爾瑪全球電子商務與科技執行長Neil Ashe曾說。
它的「社會基因體計畫」(Social Genome Project)監控社交媒體上的公開對話,參透消費者的社交DNA,藉以預測消費趨勢。沃爾瑪開發的Shopycat禮品推薦APP,「透過社會基因體計畫,分析朋友的臉書上的讚、分享、發文等動態,解除送禮壓力,提高送禮樂趣。」
當人們在線上展現我們的喜怒哀樂時,沃爾瑪就從分析臉書和推特的對話,在趨勢轉成需求前,成功預測棒棒糖蛋糕機、電動榨汁機的需求,立刻進貨、鋪貨。
數據讓沃爾瑪(Walmart)能預測未來趨勢,抓出過去錯誤
除了預測未來,即時數據和分析,讓沃爾瑪從異常銷售數字中,立即抓出定價失誤,或發覺特定門市根本未將商品上架的問題。機器學習把解決問題的時間從2~3週,大幅縮短為20分鐘。「若你得花上一週或一個月分析你的銷售數字,才能獲得洞見,你那段時間的營收已經蒙受損失。」沃爾瑪資深統計分析師Naveen Peddamail說。
為了收集消費者資訊,沃爾瑪甚至在2012年推出了自己的搜尋引擎Polaris。今年2月,沃爾瑪再度收購以色列科技新創Aspectiva,利用其自然語言處理功能 (Natural Language Processing),讓電腦擁有理解人類語言的能力,分析客戶的產品評論等用戶生成內容,並結合其瀏覽行為,以提供個人化的產品推薦。
沃爾瑪每小時產生約美國國會圖書館館藏167倍的數據,這些通通餵給雲端。沃爾瑪和微軟聯手建立全球最大的私人雲,每小時從百萬名消費者身上收集2.5 petabytes非結構化的數據,做出行銷、採購、鋪貨、庫存管理等各種決策。有一說,此舉是要和亞馬遜的Amazon Web Services (AWS)一別高下。
衝刺電子商務戰場,營造個人化體驗、用AI 工智慧鞏固生鮮市場
電子商務上,沃爾瑪仍看不到 Amazon 亞馬遜的車尾燈。
為此,沃爾瑪接連併購 Jet.com、Bonobos、中國電商 JD.com、及砸160億美元買有「印度亞馬遜」之稱的 Flipkart,去年沃爾瑪亦翻新官網,挾其龐大的數據能力,用消費者的所在地、瀏覽和購買歷史,加強區域與個人的個人化體驗。
例如,顯示當地熱門商品、通常一起合購商品、「我的門市」生鮮配送服務;提供「輕鬆續訂」功能,類似亞馬遜網站上的快速按鈕(Dash button)。去年第四季,沃爾瑪的電子商務營收成長43%,eMarketer並預測今年底沃爾瑪將分食4.6%的市場,較去年成長4%,居全美電商第三名。
沃爾瑪抓緊數據,苦苦追趕,有其苦衷。根據Accenture 2016年的調查,58%的消費者傾向在有個人化推薦的網站購物,一旦沒有,最快60秒就會失去興趣;SmarterHQ的報告則指出,在這樣的情況下,47%的消費者會直接轉往亞馬遜,便宜了沃爾瑪的頭號競爭對手。
為了拉抬線上銷售,沃爾瑪祭出廉價生鮮優勢。去年底全美有1600家門市提供生鮮配送,3100家門市設提貨中心。亞馬遜迅速回防,今年4月,旗下的全食超市推出第三波降價,以及2小時生鮮配送,1小時店內提貨,要挖沃爾瑪牆角。
這是一塊沃爾瑪輸不起的戰場。不同於亞馬遜,生鮮佔沃爾瑪全美近6成營收。金雞母保衛戰,沃爾瑪用AI和相機打造「新鮮度演算法」,名之「伊甸園」(Eden),用AI檢查蔬果缺陷和新鮮度,預測腐壞日期,確保蔬果從農場到貨架全程新鮮,終結食物(成本)浪費。在全美43個配送中心試用6個月,已替沃爾瑪省下8600萬美元,預計5年內將省20億美元。
在此之前,沃爾瑪必須派員在配送中心先目視檢查送進來的生鮮,接著再手動檢查是否符合美國農業部和沃爾瑪內部的食品標準。
「伊甸園源自我們生鮮營銷團隊工程師間的一場駭客松。」沃爾瑪部落格說。在6個月內,他們量化了美國農業部和沃爾瑪內部的食品標準,並發給稽查員一支iPhone,用Eden的APP記錄各種蔬果在不同生命週期時的樣貌,是否符合各項食品標準。這百萬張照片的資料庫,成了人工神經網絡進行深度學習最佳教材。
當稽查員在現場拍下照片時,機器將比對資料庫中的圖像,經過一層層,千百萬個神經元的數值運算後,評估蔬果新鮮度,預測保存期限,最後決定接受或退貨。沃爾瑪還把iPhone送到農夫手上,讓他們在農產品運送前先拍照,通過伊甸園把關再上路,從頭減少因品質而被退貨所衍生的成本。
「這代表(我們)能更有效率地催熟香蕉,當番茄還長在藤上時,就預測出它的保存期限,或依此調整蔬果上架的優先順序。」沃爾瑪供應鏈技術副總工程師Parvez Musani分析。販賣生鮮是一場和時間賽跑的賭局。時間,就是金錢。
除了產地和配送中心的品管,他們發現運輸過程中的溫度,也會影響蔬果新鮮度。為此,伊甸園即時監控蔬果在貨車裡的溫度,若發現溫度飆升導致蔬果「短命」2天,則立刻重新安排貨車路線,送到較近的配送中心,減少損失。
Musani舉例,沃爾瑪的明星商品香蕉,來自7個拉丁美洲國家,鋪貨到全美4千多家門市。不久的未來,在跨洲、跨國、跨州的長途運送過程中,伊甸園會重新估算「新鮮度」,決定香蕉運到哪裡。「最後香蕉會運到較近的門市,確保最新鮮,消費者樂於買一串美味香蕉,人人皆大歡喜。」
跟 Amazon 亞馬遜搶食 AI 語音購物市場
眼紅於亞馬遜語音助理Alexa登堂入室,開口即可在亞馬遜下單,沃爾瑪也想搶食語音購物市場。
近來的專利申請,透露沃爾瑪打算在產品中內建物聯網電子標籤,以監控家用品的使用情況,例如追蹤保存期限,或你提起洗潔精的次數,藉此推測何時需要補充,自動加入你的購物清單,並為沃爾瑪提供顧客行為的龐大數據,包括產品使用的時間和頻率。
今年4月起,直接呼喚Google Assistant也能在沃爾瑪下單,可在全美超過2100家門市提現貨,800家門市領取網購商品。由於語音下單容易指示不清(例如:買2罐洗衣精),為求準確,沃爾瑪顧客的消費記錄將和Google Assistant帳號綁定,以判斷脈絡。
儘管目前語音購物對營收的貢獻很小,分析師紛紛預測這是未來趨勢。為了「不落人後」,沃爾瑪甚至投資一家針對上流社會的個人購物服務新創Jetblack,會員可用簡訊「遠端遙控」購物員幫他們購物,年費要價600美元。
簡訊的文字,是絕佳的機器訓練素材。「沃爾瑪正在利用Jetblack的大批人力來訓練其AI,盼其有朝一日能提供自動化的個人購物服務,為搜尋欄消失,聲控購物成為主流的那一天,提早做好準備,」Jetblack執行長Jenny Fleiss告訴《華爾街日報》。該報分析,沃爾瑪將該投資視為AI和語音購物的研究中心,打算用它來打造和亞馬遜Alexa抗衡的秘密武器。
而JetBlack正是從沃爾瑪位於矽谷的科技孵蛋器Store No.8孵出來的新創公司。為了尋找下一代的零售科技,沃爾瑪透過Store No.8來孵化、投資新創,與創投和學術界合作,開發機器人、虛擬實境、機器學習和AI技術。
AmazonGo會是沃爾瑪的未來嗎?
自去年10月底,沃爾瑪旗下的倉儲式商店Sam’s Club宣布將在德州開第一家無結帳員的超市後,大家都在揣測沃爾瑪超市何時會跟上AmazonGo的無人店。
4月底,沃爾瑪公布了它的「未來超市」。它改造了紐約州Levittown的門市,化身「零售智能實驗室」(Intelligent Retail Lab),在真實運作的超市裡,裝滿感應器、攝影機、並建有龐大的數據中心。「這些硬體佈線之長足以爬聖母峰5次,處理能力之強大每秒能下載3年份的音樂(27000小時)。」沃爾瑪的部落格寫著。
5萬平方呎,3萬件商品,超過百名員工,可以確定的是,沃爾瑪的未來藍圖,不是AmazonGo。
具有人工智慧的攝影機,並非用來分辨消費者拿了什麼,好自動結帳,而是用來監控貨架上的存貨。機器「看見」架上商品,準確辨識品項和數量,並對照預測銷售需求的量,即時通知員工哪些商品空了,立刻補貨,或哪些放太久,立即下架。如此一來,確保架上永遠有貨,而且絕對新鮮。
這不是沃爾瑪第一次用AI來即時盤點庫存。
走進今天的沃爾瑪,你可能會碰到Auto-S貨架掃描機器人,穿梭在繁忙的貨架間。
自駕車的感應器和人工智慧,讓它能即時辨識路徑中的障礙物,優遊於樑柱、顧客、店員之間,避免碰撞。身高2英尺(約60公分),機器手臂最高可達8英尺高,裝有高解析度相機可快速掃描架上存貨、標價標籤和商品位置,而且免傳雲端,運用卡尼基美隆大學研發的Hawxeye人工智慧,機器人可現場用機器學習進行圖像辨識,加快分析速度,減少無用數據。
不到1小時,機器人就掃完數十個貨架,找出缺貨、庫存過低、沒有標籤、標價錯誤和錯置的商品,通知店員處理。在過去,這得花上一群人數天時間才能完成。
目前全美有50家沃爾瑪使用Auto-S貨架掃描機盤點架上商品。目前總里程650英里(近1千公里),尚未發生任何事故。來源:KPIX CBS SF Bay Area / 沃爾瑪
這提升了顧客的便利性,確保他們總能在對的貨架上找到想買的東西。對沃爾瑪而言,這能降低人事成本,減少貨架空間的浪費,但它還有更重大的意義:「驅動這類新科技的動力,是走向全通路零售的必要性。為了提供當天、低價或最後一哩運送,你必須以這些門市做為配送中心。但要實現這個目標,他們真的需要即時掌握架上有什麼,」Auto-S的製造商Bossa Nova執行長Bruce McWilliams接受Venturebeat採訪時說。
入口處的自助提貨塔就是明證,只要掃描你的網路訂單條碼,45秒內你的貨就會出現在輸送帶上,取貨變得跟「高科技自動投幣機」一樣方便。自駕車配送也進入測試階段。
去年11月,沃爾瑪宣布與福特合作,用自駕車宅配;7月,和Waymo(Alphabet旗下子公司,專門研發自駕車)聯手,在亞利桑那州小規模試點,「http://xn--walmart-6p3l44vn4ljhs1l8c981cucbz07isk0a.com/grocery下單,選擇到店取貨,我們的個人購物助理便會依據取貨時間,細心準備訂單上的商品。剩下的就交給Waymo。Waymo會接送顧客往返門市取貨,你可以利用這段時間完簡訊、小睡、工作,隨心所欲。」沃爾瑪部落格如此描述。
這一切聽起來,像是科幻小說?
沃爾瑪可不這麼認為,「今天,變化的速度很快。10年前,多數客戶還在讀第一代iPhone的消息,懷疑是否實用。現在,他們用手機上買東西,就期望宅配到府或店裡取貨 – 而且通常是當天,幾小時內,甚至幾分鐘內,」沃爾瑪執行長董明倫(Doug McMillon)說,「零售商得適應這些變化 – 在某些領域甚至引領潮流 – 不然就會落後並消失。」
附圖:圖說:去年改版後的沃爾瑪網站,新功能包括當地熱門商品、快速追蹤訂單、快速續訂、我的當地門市服務等,強化區域及個人化體驗。來源:沃爾瑪
圖說:伊甸園的APP介面,機器藉由照片的圖像辨識和比對,預估蔬果新鮮度。來源:沃爾瑪
圖說:只要45秒,16英尺高的自助提貨塔,就會準備好你訂的商品。來源:沃爾瑪
資料來源:https://ai-blog.flow.tw/walmart-ai-data-retail