亞馬遜云科技關于機器學習的“靈魂拷問” ,這樣的答案硬核!| 云途專欄

來源: 亞馬遜云科技
作者:亞馬遜云科技
時間:2021-07-19
17032
在當今時代,AI與機器學習的社會影響毋庸置疑。2021年ARK Invest發(fā)布了年度大創(chuàng)意報告Big Ideas 2021強調了在創(chuàng)新領域的最新發(fā)展,并將深度學習(Deep Learning)列為本世紀最重要的軟件突破。

1626678793(1).png

在當今時代

AI與機器學習的社會影響毋庸置疑

2021年

ARK Invest發(fā)布了年度大創(chuàng)意報告

Big Ideas 2021

強調了在創(chuàng)新領域的最新發(fā)展

并將深度學習(Deep Learning)

列為本世紀最重要的軟件突破

本期《云途》

我們將深入了解

企業(yè)在開發(fā)機器學習潛能時

可以為企業(yè)高層所用

讓其借鑒并學習的規(guī)律

調研結果顯示,人們對人工智能(AI)/機器學習(ML)作為轉型工具時所發(fā)揮的價值有一定認識,但在探討其意義以及如何確定項目優(yōu)先級的時候,人們的看法卻有明顯區(qū)別。

如何讓企業(yè)高效發(fā)揮出這些工具的潛能?在現實中,我們大多數人每天都要多次用到基于AI和ML的系統(tǒng)。例如,您給一張支票拍照,銀行所開發(fā)的機器學習系統(tǒng)就能識別出支票上寫的內容。

機器學習在我們日常生活中的普及,證明了企業(yè)利用創(chuàng)新技術的優(yōu)勢正在擴大,但是,這并不代表企業(yè)已經做到了完美,畢竟企業(yè)一方面承認機器學習的價值,另一方面又不愿賦予其業(yè)務優(yōu)先級和這項技術本應有的地位。

一直以來,亞馬遜云科技機器學習解決方案實驗室,已經幫助無數的客戶采用了機器學習技術,而其中大多數成功的案例都表現出了以下的特點。

為了幫助企業(yè)更好地應用機器學習技術,我們?yōu)槠髽I(yè)制定了雄心勃勃、自上而下的愿景。此外,還要求企業(yè)必須把機器學習定為最高業(yè)務優(yōu)先級。

如果沒有這些舉措的話,企業(yè)對機器學習的巨大轉型價值將僅停留在理解層面,而很難真正獲得切實收益。

當整個組織架構都持開放的狀態(tài),數據可以幫助企業(yè)做更好的決策,更好地應對突發(fā)事件,增強客戶體驗,發(fā)現新的業(yè)務機會,并提高員工的工作效率。

Q1 企業(yè)在應用過程中還有哪些短板需要補齊?最常遇到的障礙又有哪些呢?

事實證明,過去的五年,企業(yè)最常遇到的障礙是技術瓶頸,換種方式來說,與成本息息相關。

從前,只有那些技術成熟的大型企業(yè),才有能力負擔技術基礎架構和人力來應用機器學習。

如今,云計算已經消除了這些障礙,現在的公司無論規(guī)模大小還是專業(yè)技能水平高低,都可以廣泛地應用機器學習。

現階段,我們看到企業(yè)遇到的障礙通常聚焦在業(yè)務和文化層面。要定義并執(zhí)行一個野心勃勃的愿景并非易事,還需要時間的積累。

開發(fā)機器學習應用要經歷一個迭代的過程,需要經歷不斷試驗。如果一家企業(yè)的文化并不鼓勵試驗精神,或者認為必須避免失敗,那這就會成為一個巨大障礙。

不過一個有趣又令人欣慰的現象是,即使許多企業(yè)認為失敗不可接受,機器學習仍然得到了越來越廣泛的應用,這從某方面證明了機器學習技術的勢不可擋。在這種情況下,對試驗文化的需求就愈發(fā)迫切。經過不斷試驗,企業(yè)從中獲取的經驗也會愈加豐富。

雖然對于某些類型的業(yè)務和行業(yè)來說,應用機器學習的過程會相對較慢,但是這一技術仍然在日益普及。

Q2 人才、基礎架構和應用AI/ML問題的最佳化解之道是什么?

目前,雖然云計算解決了大部分基礎架構的問題,但是企業(yè)仍然需要確保技術人才運用合適的工具。

這也是為什么我們把機器學習服務打造成三層堆棧,堆棧從上至下,對機器學習專業(yè)技能的要求越來越高。企業(yè)剛剛踏上機器學習之旅時,就需要制定一個計劃來重新培訓技術人員,并提供相應的工具和服務。

對于剛剛接觸機器學習的公司來說,如果其軟件工程師擁有亞馬遜云科技的技術經驗,他們就立刻可以開始應用高階的機器學習服務。

當工程師進一步深入地發(fā)展機器學習技能時,就可以研究下一層的堆棧。亞馬遜在培訓自己的工程師掌握機器學習技術方面積累了很多成功經驗,因此我們也向您推薦這種方法。

您當然可以從零開始組建自己的機器學習專家團隊,但是我們認為,培訓您現有的技術人員,拓展他們的職業(yè)成功路徑,是有價值的。

Q3 很多公司都希望在AI方面的投入能得以顯現,如何讓那些非IT專業(yè)的領導層更好地了解AI以及AI如何符合他們的業(yè)務目標?

亞馬遜在自身的業(yè)務領域中廣泛運用AI/ML技術已有20余年的經驗。以往的經驗讓我們認識到,必須同時向業(yè)務領導者和技術領導者普及機器學習。

為此,我們在亞馬遜內部開發(fā)了相關培訓課程。兩年前,我們將該技術培訓,加入到亞馬遜機器學習大學課程。

一年前,我們在re:Invent峰會上推出了Embark課程,該課程結合了機器學習大學的技術培訓以及針對業(yè)務領導層定制的新課程。

Embark項目的主要目的就是揭開機器學習的神秘面紗。在完成Embark業(yè)務培訓之后,高層領導者就會明白機器學習最適合解決哪類問題,以及如何確定哪些業(yè)務領域應該適用機器學習。

為此,我們研討了來自各行各業(yè)的真實案例——包括亞馬遜自身以及正在亞馬遜云上應用機器學習的10萬多家客戶。

在轉型成為一個由AI驅動的組織過程中,他們遇到了各種各樣的挑戰(zhàn),也因此學會了如何找到戰(zhàn)略支點來創(chuàng)建強大的AI戰(zhàn)略、數據戰(zhàn)略和協(xié)作文化,這幫助他們的組織成功地完成了AI和機器學習的轉型。

針對那些參加Embark課程的客戶,我們也向他們展示了機器學習的實際收益。

來自亞馬遜機器學習解決方案實驗室的數據科學家,將與客戶團隊攜手,針對實際的業(yè)務用例,開發(fā)全功能的機器學習概念驗證。

我們幫助客戶識別并定義了這些用例后,客戶就可以利用亞馬遜云科技的ProServe或通過自己的開發(fā)者團隊進入生產環(huán)境。

Q4 在著手開展機器學習之旅前哪些因素對于成功至關重要?

對于業(yè)務領導來說,最重要的是要意識到他們將可能遇到非技術性的挑戰(zhàn),也就是說,這些挑戰(zhàn)可能大部分來自于組織架構和人員。

01 其中最首要的是制定數據戰(zhàn)略。

如果您的決策架構是由數據驅動的,那么,您的技術專家和業(yè)務專家之間的協(xié)作將會產生顯著的效果,這對于機器學習來說是關鍵與核心。

機器學習的意義就在于找到數據的規(guī)律。如何制定一個有效的數據戰(zhàn)略涉及許多方面,本文無法全面展開,但Embark培訓課程對此進行了深入探討。

應該納入考慮的內容包括:確保數據訪問是受控的(但并非禁止),確保原始數據和衍生數據都可用,以及預期能夠在機器學習中利用多模式數據(例如:結構的、半結構的、非結構的)。

舉例來說,假設我們需要為客戶出一個報價,然后通過電子郵件發(fā)送。

傳統(tǒng)的方式要依賴客戶的歷史數據,而這個數據可能在數據庫里。

假設您需要找到之前客戶所接受報價中的類似圖像,您可以通過機器學習,利用圖像等不同類型的數據,用計算機的視覺功能找到與之類似的圖像。這也就是我所說的半結構的或非結構的數據。

如今,大家都有海量的數據,已不適合放入傳統(tǒng)的數據庫,而機器學習則成為從數據提取洞見的非常好用的工具。

02 第二個挑戰(zhàn)來自人才,我們希望機器學習能夠產生出乎意料的效果,由此激勵工程師提升自我技能。當然,您可以招聘數據科學家和機器學習工程師來達到這樣的目的,但是這些技術的要求很高,而且人才供不應求。

目前,我們已經找到了快速、有效的方法來培訓現有的技術團隊。這不是說您完全不用再招聘新技能型工程師人才,而是說,您不用完全依賴招聘來構建起整個團隊。

亞馬遜的機器學習大學以我們內部開發(fā)的培訓課程為基礎,致力于幫助我們的員工獲得新技術,這部分課程現在已經納入了Embark課程。我們在培訓自己的員工方面獲得了相當的成功,因此我們也相信,這一方法對其他公司也會有所幫助。

03 下一個挑戰(zhàn)是找到有足夠業(yè)務影響,且適合通過機器學習來解決的問題。

企業(yè)的業(yè)務領域專家可以就此提供有價值的洞見。在剛開始的時候,您應該選擇那些成功率高,且具有充足業(yè)務價值的項目。

這些項目所交付的成果能夠打動公司的領導層,他們會贊不絕口:“哇,這太棒了。我的部門也遇到了一些業(yè)務挑戰(zhàn),我也希望利用機器學習來解決?!?/p>

我們在Embark業(yè)務培訓中廣泛探討了如何做到這一點,在與客戶溝通的過程中也有所涉及。我們還特地邀請客戶的業(yè)務領導和技術領導同臺探討,共同找到他們投資回報率最高的業(yè)務問題,并通過機器學習來解決這些問題。這種協(xié)作確保了關鍵利益相關者,在項目的初始階段就業(yè)務目標達成共識,攜手努力。

這一點至關重要,不僅有助于達成領導者的預期成果,還能確保企業(yè)采用機器學習最終獲得成功。

04 最后一個關鍵性的挑戰(zhàn)是如何在您的企業(yè)中擴大機器學習的使用規(guī)模。

大規(guī)模運行機器學習遇到的技術性問題可以通過亞馬遜云科技所提供的服務和解決方案來解決,它們可以擴展技術基礎架構,而且成本效益很高。

此外,解決這個挑戰(zhàn)還有一個業(yè)務因素,就是當業(yè)務部門了解到機器學習的強大性能和轉型能力之后,他們會希望在自己的業(yè)務線中實施相關解決方案。

屆時,您就需要考慮如何擴展機器學習工程資源的需求。從一開始,您就需要考慮設立一個集中式的機器學習和數據科學團隊,在整個組織內收集數據,并同時在業(yè)務領域設立一個去中心化的團隊,來識別用例,同時搭建、測試和部署不同的模型。

能解決所有問題的“萬靈藥”是不存在的

在遇到機器學習方向的挑戰(zhàn)時

我們建議您采用全面且規(guī)范的方法

亞馬遜云科技的ML Embark項目

會幫助業(yè)務領導在開展機器學習之初

就清晰意識到自身需要做出

哪些關鍵性的決策

我們正在努力讓機器學習

變得更加簡單易用

Embark項目

是我們向這一目標邁出的一大步

立即登錄,閱讀全文
版權說明:
本文內容來自于亞馬遜云科技,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯系管理員(zzx@kchuhai.com)刪除!
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家