• <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

    <table id="fficu"></table>

    <sup id="fficu"></sup>
    <output id="fficu"></output>
    1. ACS880-07C
      關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
      橫河電機-23年10月11日
      2024
      工業(yè)智能邊緣計算2024年會(huì )
      2024中國自動(dòng)化產(chǎn)業(yè)年會(huì )
      2023年工業(yè)安全大會(huì )
      OICT公益講堂
      當前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

      資訊頻道

      中國AI產(chǎn)業(yè)鏈底端眾生相:艱難生存的“人工”團隊
      • 點(diǎn)擊數:555     發(fā)布時(shí)間:2018-11-17 19:07:00
      • 分享到:
      關(guān)鍵詞:

      有多少“智能”,就有多少“人工”,這位人工智能數據標注創(chuàng )業(yè)者的夢(mèng)想是建一個(gè)“富士康”,但希望越來(lái)越渺茫

      從人工智能發(fā)展高地北京到河南鄭州,只需要兩個(gè)小時(shí)的高鐵,那里有中國最大的代工廠(chǎng)富士康。再從鄭州火車(chē)站出發(fā),半小時(shí)車(chē)程,到達一棟不起眼的寫(xiě)字樓,打開(kāi)一扇沒(méi)有任何標志的大門(mén),就是目前河南最大的人工智能數據標注工廠(chǎng)翊澳數據的總部。

      聚集在北京的人工智能公司里,隨處可見(jiàn)人臉識別機器以及實(shí)時(shí)的大數據熱點(diǎn)圖。但這家數據工廠(chǎng)里,并沒(méi)有任何智能的樣子,也沒(méi)有普通工廠(chǎng)里的流水線(xiàn),更像是一間網(wǎng)吧——裝修簡(jiǎn)單,幾十臺電腦依次排開(kāi)。

      正值午休時(shí)間,一半的電腦前面空空如也,還有數十名員工坐在電腦前,或是吃著(zhù)打包來(lái)的午飯,或是掏出手機打游戲,也有部分標注員還在處理一張張模糊或清晰的照片。

      數據標注行業(yè)流行著(zhù)一句話(huà),“有多少智能,就有多少人工?!蹦壳癆I算法能學(xué)習的數據,必須通過(guò)人力逐一標注,這些人力為AI產(chǎn)業(yè)提供養料,這是AI金字塔的基礎,處于最底層。

      此前,一些數據標注工廠(chǎng)被冠以“血汗工廠(chǎng)”的名號,為了應對龐大的數據標注需求,標注員們必須加班加點(diǎn)盯著(zhù)電腦屏幕,夜以繼日地重復枯燥的工作,但眼前的這個(gè)工廠(chǎng)里,似乎有些輕閑

      “聽(tīng)說(shuō)AI很火,我們也想參與進(jìn)來(lái)?!瘪窗臄祿偨?jīng)理靳建偉對《財經(jīng)》記者說(shuō)。

      靳建偉經(jīng)歷豐富,善于追逐潮流。微信最火的時(shí)候他做過(guò)微信推廣,拼多多起來(lái)后在上面賣(mài)過(guò)襪子,還在關(guān)注短視頻營(yíng)銷(xiāo)行業(yè),“你知道抖音推廣吧?就是一個(gè)后臺可以操縱一百個(gè)賬號那種,據說(shuō)很賺錢(qián)?!?/p>

      大多數AI初創(chuàng )公司還處于依靠融資發(fā)展的階段,但數據標注產(chǎn)業(yè)更像傳統行業(yè),拿一單數據結一單錢(qián),江湖中流傳的傳說(shuō)是,這個(gè)領(lǐng)域已經(jīng)創(chuàng )造了不少“一夜暴富”的故事。

      被這樣的故事吸引,不少像靳建偉一樣的人加入了這場(chǎng)淘金游戲,但現實(shí)給了他們當頭一棒。

      2018年,河南省的數據標注公司死掉了一大半,剩下的幾乎都在艱難求生,接受《財經(jīng)》記者采訪(fǎng)時(shí),靳建偉已經(jīng)兩個(gè)多月沒(méi)有接到新的訂單,工廠(chǎng)員工從600人,銳減至200人,他覺(jué)得自己恐怕需要開(kāi)始找下一個(gè)風(fēng)口了。

      撞進(jìn)了AI圈

      靳建偉今年28歲,2017年以前,他甚至沒(méi)聽(tīng)說(shuō)過(guò)“數據標注”這個(gè)詞。

      他并不懂AI算法和技術(shù),也不太清楚AI到底能解決哪些問(wèn)題,2017年,他偶然聽(tīng)說(shuō)做數據標注能賺錢(qián),當時(shí)他正從事證券銷(xiāo)售業(yè)務(wù),由于沒(méi)有資質(zhì),公司被關(guān)停,他找到一個(gè)賣(mài)保健品的朋友,共同成立了這家數據標注公司。

      2017年,中國AI創(chuàng )業(yè)開(kāi)始達到頂點(diǎn)。對數據標注的需求也迅速爆棚。河南是人口大省,數百家數據標注公司在此誕生。

      靳建偉算了一筆賬,一個(gè)成熟的標注員,月產(chǎn)值能做到7000元,除去3000元的工資和質(zhì)檢、場(chǎng)地設備等費用,公司能賺1500元。

      “那我不斷招人就行,如果招100個(gè)人,一個(gè)月就賺15萬(wàn)元?!苯▊フf(shuō)道,“怎么看都覺(jué)得這個(gè)生意靠譜?!?/p>

      有電腦、有場(chǎng)地,再迅速招一批沒(méi)有學(xué)歷、工作經(jīng)驗要求的數據標注員,就可以迅速上手。

      深度學(xué)習的關(guān)鍵在于大量的數據訓練,數據訓練之前,必須對這些數據進(jìn)行明確的標注。例如,機器需要識別斑馬線(xiàn),就必須提供大量標注了斑馬線(xiàn)的數據來(lái)進(jìn)行學(xué)習,數據量足夠大時(shí),機器就可以識別出任何角度的斑馬線(xiàn)。

      這意味著(zhù),在某種程度上,AI算法的優(yōu)化,取決于數據標注的質(zhì)量,而把控這些質(zhì)量的,是完全不懂AI技術(shù)的一群人。

      一名沒(méi)有任何經(jīng)驗的標注員,通過(guò)半天的培訓即可開(kāi)工,一兩個(gè)月之后可變成熟練工,一天就可以完成1500張-2000張圖片的標注。

      需要標注的圖片數據從客戶(hù)提供的數據處理平臺上打包下載,根據不同的需求進(jìn)行標注,常見(jiàn)的包括物體識別和人臉識別,物體識別主要是“畫(huà)框”,人臉識別則是“打點(diǎn)”。

      完成后會(huì )進(jìn)行一到兩道的質(zhì)量檢測程序,來(lái)確保標識準確率,合格后會(huì )重新傳送到客戶(hù)的數據平臺上。

      然后,這些數據會(huì )被應用到自動(dòng)駕駛、AI安防、智能身份認證等新興應用領(lǐng)域。

      依靠這些應用,人工智能公司在資本市場(chǎng)頗受追捧,投中研究院發(fā)布的數據顯示,2018年上半年,進(jìn)入商業(yè)化階段的中國人工智能行業(yè)已經(jīng)獲得超過(guò)400億元人民幣的融資。

      這400億元的資金,僅有極少部分流入了數據標注行業(yè)。商業(yè)信息服務(wù)平臺企名片收錄的標簽為“數據標注”的公司共有15家,2018年,這15家公司共完成6筆融資,單筆融資金額約為1000萬(wàn)元人民幣左右,總計不超過(guò)1億元人民幣。

      靳建偉還沒(méi)考慮過(guò)融資這件事,他聽(tīng)說(shuō)北京的AI公司都在以?xún)|為單位進(jìn)行融資,但他的思維和之前的數次創(chuàng )業(yè)沒(méi)有區別,找客戶(hù),做業(yè)務(wù),能賺錢(qián),才是應該做的事情。

      單打獨斗在當下的AI圈很難混得開(kāi)。由于完全沒(méi)有相關(guān)行業(yè)經(jīng)驗,也沒(méi)有資本加持,一開(kāi)始靳建偉只能接二手、甚至三手訂單,也即外包服務(wù)?!耙恍┯星赖墓窘恿擞唵?,自己不做,或者自己做不過(guò)來(lái),就分發(fā)給我們做,他們再從中間收取差價(jià)?!?/p>

      與很多行業(yè)一樣,渠道是核心競爭力,中間商們不需要耗費太多的人力物力,就能賺取可觀(guān)的利潤,底層的工廠(chǎng)們,加班加點(diǎn),只能勉強維持經(jīng)營(yíng)。

      這樣下去可不行。在熟悉了行業(yè)之后,靳建偉開(kāi)始主動(dòng)出擊,拓展渠道,試圖繞過(guò)中間商。從知名的頭部AI公司開(kāi)始,到所有他能找到聯(lián)系方式的中小AI企業(yè),他問(wèn)了個(gè)遍。得到的回應要么是“不需要”,要么是“我們已經(jīng)有了自己的數據標注團隊”,更多的是石沉大海,沒(méi)有回音。

      “人家上來(lái)就問(wèn)你,以前做過(guò)哪些項目,我說(shuō)不上來(lái)?!彼軣o(wú)奈。

      類(lèi)似商湯科技、科大訊飛這樣的頭部AI公司,都會(huì )自建數據標注團隊,既方便管理,也能更好地理解需求。

      但確實(shí)也有大量AI公司,由于團隊人數、資金成本有限,有外包數據標注的需求,但大部分都會(huì )通過(guò)熟悉的渠道尋找標注團隊,或者和大平臺合作,例如百度眾測平臺。

      百度眾測是百度旗下的一個(gè)類(lèi)似眾包模式的數據平臺,2014年在百度世界大會(huì )上正式推出,平臺上會(huì )分發(fā)各類(lèi)任務(wù),在行業(yè)內稱(chēng)為“放題”,包括數據采集、圖片標注、文本標注等。

      百度在中國人工智能領(lǐng)域起步早,渠道輻射廣,眾測平臺上每天都有大量的數據標注需求,并且開(kāi)放注冊,這讓靳建偉看到了機會(huì )。

      當然了,當時(shí)他還沒(méi)有意識到,更大的困難在等待著(zhù)他。

      飽一頓,饑一頓

      距離鄭州車(chē)程兩個(gè)小時(shí)的河南新鄉輝縣,甚至找不到一棟商用寫(xiě)字樓。從馬路邊一個(gè)毫不起眼的門(mén)洞上樓,就是翊澳在輝縣的工廠(chǎng),也是該公司目前規模最大的一個(gè)廠(chǎng)。

      兩層樓,近500平方米的空間里,劃分出了三片工作區域,目前僅有一片區域開(kāi)工運轉。

      翊澳下面類(lèi)似這樣的分廠(chǎng)有十幾個(gè),分布在河南省內各個(gè)縣市里。

      由于百度眾測平臺提供了訂單來(lái)源,翊澳幾乎是在一夜之間發(fā)展成這樣的規模,靳建偉拉來(lái)以前一起做證券銷(xiāo)售的同事們,讓他們回到各自的老家成立分廠(chǎng),并擔任負責人?!爸耙黄鹱鲞^(guò)事,已經(jīng)有信任關(guān)系,下面這些地方場(chǎng)地租金更便宜,員工工資也低,更省成本?!?/p>

      百度眾測給了翊澳數據第一桶金,但同時(shí)也讓靳建偉認識到這個(gè)行業(yè)的慘烈。

      他回憶,去年百度眾測上的“題”特別豐富,大量數據標注團隊都緊緊盯著(zhù),僧多粥少,百度眾測有絕對的權力來(lái)制定游戲規則。

      想要拿到“做題”資格,必須經(jīng)過(guò)數輪考核,比賽做題的速度和準確度,每一輪考核后,都有團隊被淘汰出局,最后僅剩十支團隊能進(jìn)入百度眾測的名單,每隔一段時(shí)間,就會(huì )有末位淘汰,后三名的團隊會(huì )被替換掉。

      這一過(guò)程堪比高考,工廠(chǎng)的員工大多學(xué)歷不高,以專(zhuān)科生為主,但為了賺錢(qián),他們鉚足了勁?!澳且欢螘r(shí)間我們天天刷題庫,練習,這個(gè)事情就是熟能生巧,我們單獨拉了一支20人的團隊,不干別的,就應付這個(gè)考試,來(lái)來(lái)回回折騰了好幾個(gè)月,終于考上了?!?/p>

      自去年加入百度眾測平臺開(kāi)始,翊澳數據就一直保持在前十名的位置,這也讓他們真的賺到了錢(qián)?!皬娜ツ?0月到今年上半年,百度一共給我們結了120萬(wàn)元?!苯▊フf(shuō)道。

      但他仍有怨言,在他和一些同行看來(lái),百度也不太地道。前期耗費幾個(gè)月時(shí)間的考試,似乎是在做無(wú)償勞動(dòng),“那些考試的題,其實(shí)就是真實(shí)的客戶(hù)需求,我們做完了,百度就拿去賣(mài)了”。

      只要能賺錢(qián),前期免費付出一些也未嘗不可。相比其他訂單來(lái)源,百度眾測給的單價(jià)更高,平臺上的訂單價(jià)格是按照每個(gè)標注員每天8小時(shí)工作量測算,正常情況下8小時(shí)能標注1200個(gè)數據框,價(jià)格是240元人民幣。

      為了能夠擴大收入,靳建偉要求員工一天能標注2000個(gè)數據框,“做得越多,賺得越多”。

      依靠百度眾測,靳建偉嘗到了甜頭。但好景不長(cháng),百度眾測平臺上的單越來(lái)越少,甚至出現長(cháng)時(shí)間的“斷糧”情況。

      目前整個(gè)AI行業(yè)都處于起步階段,數據與算法交替磨合前進(jìn),需求在不斷變化,對于數據標注的需求也是周期性的,并非源源不斷。例如,2017年,數據標注行業(yè)就很少接到車(chē)牌標注的訂單,因為標注量已經(jīng)足夠多,算法需要時(shí)間去慢慢消化,并落實(shí)應用,然后再發(fā)現其他數據需求。

      突然無(wú)題可做,這對于當時(shí)已經(jīng)有數百人規模的翊澳數據來(lái)說(shuō),壓力巨大,每天員工的工資就是一筆不小的開(kāi)銷(xiāo)。

      為了維持運轉,他只能再去找新客戶(hù),他們曾經(jīng)接過(guò)自動(dòng)駕駛明星公司Momenta的二手訂單,他降低價(jià)格,說(shuō)服了Momenta直接給訂單,繞開(kāi)了中間商。

      自動(dòng)駕駛企業(yè)對數據量的要求非常大,路況信息龐雜,采集到路況圖片后,需要人工對路牌、障礙物、交通信號標志等多種信息進(jìn)行標注。

      Momenta成立兩年時(shí)間,已經(jīng)完成5輪融資,融資金額超過(guò)1億美元。在同行看來(lái),接到這樣的明星客戶(hù),意味著(zhù)能在業(yè)內樹(shù)立口碑,且融資能力強,不缺錢(qián)。

      但Momenta給到翊澳數據的標注價(jià)格非常低,幾乎只有百度眾測的30%,他們完全賺不到錢(qián)?!澳且矝](méi)辦法,還是要做,不然我手里這么多員工,吃什么?”

      采訪(fǎng)進(jìn)行到一半時(shí),靳建偉突然接到了百度眾測打來(lái)的電話(huà),過(guò)去兩個(gè)月,他多次試圖聯(lián)系百度眾測平臺,但得到的回應都很冷淡,而這一次,對方告訴他,馬上平臺上會(huì )放題,讓他提前做好準備。

      “其實(shí)我有好幾次都想放棄,每次一冒出放棄的念頭,就有消息說(shuō)數據馬上要來(lái)了?!?/p>

      這個(gè)消息讓他既欣喜又糾結,百度眾測一旦放題,意味著(zhù)收入可以很快跟上,但他現有的團隊很難保證同時(shí)兼顧百度和Momenta兩頭,雖然出價(jià)低,但Momenta是他唯一的標桿客戶(hù),也有必要長(cháng)期維系。

      距離翊澳數據總部幾十公里之外,是富士康的鄭州園區,員工數量超過(guò)25萬(wàn)人,靳建偉曾經(jīng)的夢(mèng)想是做出一家人工智能領(lǐng)域的富士康,但現在,他發(fā)現這個(gè)夢(mèng)想有些遙不可及。

      隨著(zhù)AI產(chǎn)業(yè)的興起,各行各業(yè)都有AI化的需求,也進(jìn)一步刺激了數據標注行業(yè)的發(fā)展,翊澳數據這樣的數據工廠(chǎng)只是其中一環(huán),AI公司、數據標注平臺、中介、數據工廠(chǎng),甚至包括個(gè)人,共同組成了這一條產(chǎn)業(yè)鏈。

      其中,中介們最為活躍。

      除了Momenta,在靳建偉尋求出路的過(guò)程中,北京數據標注初創(chuàng )公司星塵數據主動(dòng)聯(lián)系了他,也是唯一一家主動(dòng)找上門(mén),并能提供訂單的公司。

      星塵數據位于北京三里屯,2018年1月完成1000萬(wàn)元人民幣的Pre-A輪融資,公司運營(yíng)副總裁商宇通過(guò)百度眾測平臺發(fā)現了翊澳?!八麄円恢北3衷谄脚_的前幾名,說(shuō)明標注質(zhì)量有保障?!鄙逃罱邮堋敦斀?jīng)》記者采訪(fǎng)時(shí)說(shuō)道。

      與翊澳數據一樣,星塵數據的辦公室也找不到任何標志,創(chuàng )始團隊大多有美國工作背景,他們像硅谷的初創(chuàng )公司一樣,十幾名員工擠在一起,整個(gè)公司看起來(lái)還沒(méi)有靳建偉個(gè)人辦公室大。

      但他們比靳建偉更了解這個(gè)行業(yè)。

      “我們想做的其實(shí)是一個(gè)數據標注平臺,”商宇說(shuō),“能夠對接需求方和標注團隊,以及有時(shí)間和余力做標注的個(gè)人,就像是數據標注里的滴滴?!?/p>

      平臺是長(cháng)期目標,短期內,星塵做的是中介的工作,他們去競標訂單,然后找到工廠(chǎng)承接。

      但大家都處于摸著(zhù)石頭過(guò)河的程度,星塵斷續給了翊澳一些小訂單,怎么定價(jià),是雙方都不太清楚的問(wèn)題。

      從鄭州去往輝縣的路上,靳建偉收到星塵發(fā)來(lái)的消息,稱(chēng)他們準備去競標一項數據采集的單子,讓靳建偉報個(gè)價(jià),他們拿著(zhù)這個(gè)價(jià)格去競標。

      “我怎么知道應該報什么價(jià)格?”靳建偉有些茫然,他沒(méi)做過(guò)數據采集的工作,但是他缺訂單,兩小時(shí)的車(chē)程中,他一直在糾結報價(jià)的問(wèn)題?!?0?30?要不然報高一點(diǎn)讓他們砍價(jià)?但是萬(wàn)一覺(jué)得太貴把我們排除了怎么辦?”

      相比他們的迷茫與矛盾,博雅立方走的是另外一條路線(xiàn)——提供定制化的數據標注服務(wù)。

      數據服務(wù)提供商博雅立方是中昌數據(600242.SH)旗下品牌,主要業(yè)務(wù)就是數據標注,團隊目前超過(guò)1000人。

      博雅立方數據服務(wù)事業(yè)部總經(jīng)理王馨比靳建偉更早看到了機會(huì ),2012年,她開(kāi)始做搜索引擎和輸入法的語(yǔ)量庫和知識庫?!澳阍诰W(wǎng)上搜索資料,和語(yǔ)音識別、圖像識別一樣,都是機器交互,也就需要不斷地給機器灌輸信息來(lái)實(shí)現?!?/p>

      AI爆發(fā)后,王馨也轉型到數據標注領(lǐng)域,除了簡(jiǎn)單的圖像數據標注,他們還做難度更高的語(yǔ)音數據標注,以及專(zhuān)業(yè)性更強的細分行業(yè)數據標注,如醫療、法律等。

      不過(guò),AI公司通常不會(huì )只找一家數據標注公司提供服務(wù),將標注需求拆分給多個(gè)團隊能夠更好地降低成本。這一過(guò)程基本通過(guò)招投標的方式來(lái)進(jìn)行,客戶(hù)主要考察過(guò)往經(jīng)驗,完成訂單所需時(shí)間,以及單價(jià)。

      在全行業(yè)都缺乏經(jīng)驗時(shí),完成訂單的效率和單價(jià)就成為主要考核因素,靈活的小團隊們在這兩點(diǎn)上,優(yōu)勢顯得更大?!跋胍胰藖?lái)外包訂單,快速完成,并不困難?!苯▊ケ硎?,“你在網(wǎng)上發(fā)個(gè)招聘信息,一天之內會(huì )有100家接不到活的團隊找上門(mén)?!?/p>

      價(jià)格方面,小團隊也更“狠心”,王馨就多次在招投標環(huán)節遇到開(kāi)出不合理低價(jià)的小團隊,“他們更想要的是客戶(hù)案例積累?!?/p>

      環(huán)環(huán)相扣的數據標注行業(yè)像是一片擠滿(mǎn)了鯉魚(yú)的池塘,偶爾一把魚(yú)食撒下來(lái),會(huì )被不擇手段地立刻分食干凈,然后餓著(zhù)肚子等待下一場(chǎng)競爭。

      快要消失的圍城?

      過(guò)去幾個(gè)月,靳建偉看著(zhù)周?chē)耐幸粋€(gè)個(gè)開(kāi)始轉型、退場(chǎng),每天都處于焦慮狀態(tài)中。

      他熟悉的一個(gè)同行,由于找不到標注的訂單,接了一份豬臉數據采集的工作,在鄉下找豬圈拍照,三天時(shí)間收入2000元。

      “我也想好了,不能這樣無(wú)限地砸錢(qián)進(jìn)去,我的底線(xiàn)是再投入100萬(wàn)元,如果還是這樣的情況,就放棄?!彼f(shuō)。

      數據標注行業(yè)越來(lái)越像一個(gè)圍城,城中人痛苦不堪,找不到出路,城外人認為這里遍地黃金,會(huì )誕生下一個(gè)富士康。

      在中國政府大力支持AI產(chǎn)業(yè)發(fā)展的政策環(huán)境之下,不少地方政府都通過(guò)各項優(yōu)惠政策,吸引AI公司落戶(hù),但數據標注行業(yè)似乎是一塊被忽視的死角。

      接受《財經(jīng)》記者采訪(fǎng)的數據標注相關(guān)團隊都表示,目前他們沒(méi)有發(fā)現任何相關(guān)的優(yōu)惠政策。

      沒(méi)有政策優(yōu)惠,也幾乎沒(méi)有任何壁壘,數據標注只能存活于產(chǎn)業(yè)鏈底端,壓價(jià)情況嚴重,生存艱難。大部分時(shí)候,數據標注團隊都會(huì )面臨兩個(gè)選擇——要么無(wú)訂單可做,要么接受虧本價(jià)。

      由于業(yè)務(wù)的不確定性,大量小型數據標注團隊都是有活就干、無(wú)活解散,這也導致標注質(zhì)量無(wú)法得到有效保證。

      中國信息通信研究院在今年9月發(fā)布的《2018年人工智能發(fā)展白皮書(shū)》中表示,在數據層面,主要存在流通不暢、數據質(zhì)量良莠不齊和關(guān)鍵數據集缺失等問(wèn)題,尤其是數據標注主要通過(guò)外包形式,勞動(dòng)力水平?jīng)Q定了產(chǎn)出的標注數據質(zhì)量。

      多位接受《財經(jīng)》記者采訪(fǎng)的AI初創(chuàng )公司創(chuàng )始人表示,他們接觸過(guò)的數據標注團隊質(zhì)量良莠不齊?!澳切祿俗F隊能做到的,我們自己也能做,可能還能做得更好,為什么要花這個(gè)錢(qián)?”其中一位創(chuàng )始人說(shuō)道。

      在商宇看來(lái),沒(méi)有技術(shù)壁壘的工作,完全可以通過(guò)平臺眾包模式,分發(fā)給個(gè)人來(lái)做,“這樣效率更高”。

      數據標注眾包模式最早出現在美國,2005年,亞馬遜推出勞務(wù)眾包平臺(Amazon Mechanical Turk),初衷是為了解決內需——管理庫存、完成圖片和產(chǎn)品分類(lèi)、翻譯文本、將語(yǔ)音或者圖片轉錄成文本等工作,隨后平臺漸漸對外開(kāi)放。截至2017年底,該平臺注冊用戶(hù)量累計超過(guò)50萬(wàn)。

      亞馬遜眾包平臺的一個(gè)標志性的成績(jì)是幫助斯坦福人工智能實(shí)驗室主管李飛飛完成了ImageNet的建立,ImageNet目前擁有超過(guò)1400萬(wàn)被分類(lèi)的圖片,大部分由該眾包平臺上5萬(wàn)名用戶(hù)耗時(shí)兩年完成。

      目前在中國,還沒(méi)有面向個(gè)人的眾包數據標注平臺,百度眾測官方平臺僅對企業(yè)開(kāi)放。

      一個(gè)現實(shí)的問(wèn)題是,眾包模式如何保證質(zhì)量?數據標準的準確度從95%提升到96%,需要團隊多花費3倍的時(shí)間?!昂芏鄷r(shí)候,由于一點(diǎn)細微的問(wèn)題,整個(gè)訂單都要重新返工?!苯▊フf(shuō)道。

      質(zhì)量問(wèn)題也是王馨認為眾包模式現階段并不可行的主要原因。

      AI在行業(yè)落地時(shí),屢遭困難,很大一個(gè)原因在于傳統行業(yè)與AI之間的隔閡仍然明顯。博雅立方作為數據標注行業(yè)里的老牌公司,同時(shí)又有上市母公司的背景,吸引了不少想要進(jìn)行AI化改造的傳統企業(yè)。

      這些公司很多仍然不清楚自己真正的需求是什么,為此,博雅立方組建了一支專(zhuān)業(yè)化的前端團隊,這些人來(lái)自于傳統行業(yè)或是AI行業(yè),在前期就會(huì )花費大量的時(shí)間進(jìn)行溝通交流,來(lái)明確應該采集哪些數據,應該做哪些維度的標注?!斑@些都是眾包模式無(wú)法提供的服務(wù)?!蓖踯罢f(shuō),“當然我們的價(jià)格也會(huì )更高?!?/p>

      以目前行業(yè)壓價(jià)情況來(lái)看,有能力做到深度、定制化服務(wù)的團隊并不多,另一方面,大部分數據標注需求,還處于相對基礎的水平,對于還未能通過(guò)AI盈利的大部分企業(yè)來(lái)說(shuō),也不愿意在數據標注環(huán)節,支付稍高的價(jià)格。

      AI是否會(huì )讓更多人失業(yè),一直是被討論的焦點(diǎn)。國際貨幣基金組織的一份報告稱(chēng),包括AI在內的新興科技將讓全球30個(gè)國家和地區的2600萬(wàn)份工作消失??萍歼M(jìn)步同時(shí)也創(chuàng )造了許多新的就業(yè)機會(huì ),數據標注就是一個(gè)由于人工智能發(fā)展而誕生的新行業(yè)。

      在缺乏行業(yè)標準、發(fā)展混亂這些現有問(wèn)題之下,數據標注行業(yè)面臨的最大隱患是,未來(lái)AI的發(fā)展可能不再需要這一環(huán)節。

      2018年10月10日,中國最大的科技公司華為發(fā)布了AI戰略,華為輪值董事長(cháng)徐直軍在臺上提到,數據標注師這樣的職業(yè)很有可能被顛覆,華為要做的改變是提升AI自身的自動(dòng)化水平,比如在數據標注、數據獲取、特征提取、模型設計和訓練等環(huán)節實(shí)現自動(dòng)化或半自動(dòng)化。

      沒(méi)有“人工”就沒(méi)有“智能”,這一幕很可能只是人工智能產(chǎn)業(yè)發(fā)展史上的短暫一幕。

      摘自《財經(jīng)》

      熱點(diǎn)新聞

      推薦產(chǎn)品

      x
      • 在線(xiàn)反饋
      1.我有以下需求:



      2.詳細的需求:
      姓名:
      單位:
      電話(huà):
      郵件:
      欧美精品欧美人与动人物牲交_日韩乱码人妻无码中文_国产私拍大尺度在线视频_亚洲男人综合久久综合天

    2. <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

      <table id="fficu"></table>

      <sup id="fficu"></sup>
      <output id="fficu"></output>