欧美优质美女网站_国产大片精品免费永久看nba_亚洲自拍与偷拍_精品久久久久久久久久久院品网_中文字幕日韩一区二区_欧美中文字幕在线_美女一区二区久久_夜夜嗨av一区二区三区免费区 _欧美一区二区在线不卡_日韩三级电影网址

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

公司簡介

杭州知衣科技有限公司是一家以人工智能技術為驅動的國家高新技術企業,致力于將數據化趨勢發現、爆款挖掘和供應鏈組織能力標準化輸出,打造智能化服裝設計的供應鏈平臺。知衣成立于2018年2月,同年獲得千萬美金A輪融資;2021年完成由高瓴創投、萬物資本領投的2億人民幣B輪融資,同年入圍“杭州市準獨角獸企業榜單”。

知衣憑借圖像識別、數據挖掘、智能推薦等核心技術能力,不斷升級服務體系,自主研發了知衣、知款、美念等一系列服裝行業數據智能SaaS產品,為服裝企業和設計師提供流行趨勢預測、設計賦能、款式智能推薦等核心功能,并通過SaaS入口向產業鏈下游拓展,提供一站式設計+柔性生產的供應鏈平臺服務。目前已服務UR、唯品會、綾致、赫基、太平鳥、海瀾之家、森馬等數千家時尚品牌和平臺。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

方案架構

當前知衣在阿里云上的整體方案架構如下,大致分為產品層、服務層、數據層以及大數據平臺。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

  • 產品層:知衣目前有多款APP應用,如主打產品知衣、增強設計協作的美念等。除此之外,我們還提供定制化API向第三方開放數據接口服務和以圖搜圖的功能。從數字選款到大貨成品交付的一站式服裝供應鏈平臺也是核心的能力輸出。
  • 服務層:相關產品的前后端系統都已經實現容器化,部署在阿里云的ACK容器服務集群
  • 數據層:主要保存原始圖片、業務系統產生的業務數據、以及OLAP數據分析服務
  • 對象存儲OSS:保存原始圖片,構建服裝行業十億級別款式庫
  • 數據庫MySQL:OLTP業務數據
  • HBase:以KV格式訪問的數據,如商品詳細信息、離線計算榜單等數據
  • 特征向量庫:由圖片識別抽取的向量再經過清洗后保存在阿里達摩院開發的Proxima向量檢索引擎庫
  • ElasticSearch:用于點查及中小規模數據的指標統計計算。設計元素標簽超過1000個,標簽維度主要有品類、面料、紋理、工藝、輔料、風格、廓形、領型、顏色等
  • 大數據平臺
  • 日志服務SLS:用于緩存經過圖片識別后的海量向量數據。SLS還有一個基于SQL查詢的告警能力,就是若向量數據沒有進來會觸發告警,這對于業務及時發現問題非常有用。
  • 離線數倉(DataWorks + MaxCompute):通過DataWorks集成緩存了圖片特征向量的日志服務作為數據源,然后創建數據開發任務對原始特征向量進行清洗(比如去重等)保存在MaxCompute,再通過DataWorks將MaxCompute清洗后的向量數據直接寫入ElasticSearch的Proxima
  • 數據挖掘 & 算法推薦:部署在ACK里的一些Python任務,主要做推薦相關的內容,比如用戶特征Embedding計算、基于用戶行為的款式圖片的推薦、相似性博主的推薦等
  • 圖片識別服務:目前圖片識別服務主要還是部署在IDC機房,5~6臺GPU服務器對圖片進行批量識別

大數據方案演進

知衣的大數據方案也是經過不同的階段不斷的演進,滿足我們在成本、效率和技術方面的追求,本質上還是服務于業務需求。

階段一:IDC自建CDH集群

我們的業務系統一開始就部署在阿里云,同時在IDC機房部署了10臺服務器搭建CDH集群,構建Hive數倉。計算過程是先將云上生產環境數據同步到CDH,在CDH集群進行計算后將計算結果再回傳到阿里云上提供數據服務。

自建CDH集群雖然節省了計算費用,但是也帶來不少問題。最主要的就是運維比較復雜,需要專業的人員進行集群的運維管理。出現問題也是在網上到處搜索排查原因,效率比較低。

階段二:DataWorks + MaxCompute替換CDH集群

為了降低運維復雜度,我們將計算任務遷移到MaxCompute,直接基于DataWorks做任務編排調度。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

階段三:ElasticSearch構建即席查詢

知款聚焦于快速發現時尚趨勢靈感,集成了社交平臺、品牌秀場、零售及批發市場、淘系電商、時尚街拍五大圖源,海量的設計靈感參考,幫助服裝品牌及設計師快速準確地預判時尚風向,掌握市場動態。其中趨勢分析板塊就需要對某個季度下各種組合條件下的設計要素標簽進行統計分析,并輸出上升、下降以及餅圖等指標。這也是我們數據量最大的查詢場景,掃描分析的數據量量級會接近百萬。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

阿里云托管版ElasticSearch相比較開源版本最大優點就是開箱即用免運維,特別的就是支持達摩院的Proxima向量檢索引擎,非常適合我們業務的多維查詢和統計分析場景。后面會在圖片識別展開講述Proxima向量引擎。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

圖片識別

我們的核心功能場景是以圖搜圖,前提是需要對海量的圖片庫數據進行識別。我們以離線的方式對圖片庫的所有圖片進行機器學習分析,將每一幅圖抽象成高維(256維)特征向量,然后將所有特征借助Proxima構建成高效的向量索引。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

模型訓練

圖片識別之前需要訓練模型。由專業的服務行業背景的人員對圖片庫進行標注,然后線下部署的GPU集群從阿里云對象存儲OSS批量拉取已標注的圖片進行訓練。為了降低標注的成本,我們采用了主動學習(Active Learning)方法,即基于一部分已標注的圖片由機器學習訓練出一個模型,然后對未標注的圖片進行預測,讓人工對預測結果再次進行確認和審核,再將標注的數據使用監督學習模型繼續進行模型訓練,逐步提升模型效果。

批量圖片識別

模型生成以后打包到Docker鏡像,然后在GPU節點上運行容器服務就可以對海量的服裝圖片進行識別,提取出高維的特征向量。因為提取的特征向量數據量很大且需要進行清洗,我們選擇將特征向量先緩存在阿里云日志服務SLS,然后通過DataWorks編排的數據開發任務同步SLS的特征向量并進行包含去重在內的清洗操作,最后寫入向量檢索引擎Proxima。

因為一次批量識別圖片的工作量很大,線下的GPU服務器計算性能有瓶頸,所以我們就借助云上彈性的GPU資源做計算資源的補充。線下GPU和云上GPU組成一個計算資源池,共同消費同一批需要進行圖片識別的計算任務,效率大大提升。云上我們購買的是GPU搶占式實例,一般是按量價格的2~3折,可以進一步降低成本。

單次圖片識別

我們以在線serving的模式在web前端提供單次單張圖片識別功能,比如用戶上傳一張圖片,通過模型的推理輸出如下結果。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

以圖搜圖

構建好服裝圖片的特征向量庫,我們就可以實現以圖搜圖的功能。當用戶上傳一張新圖片的時候,我們用之前的機器學習方法對其進行分析并產出一個表征向量,然后用這個向量在之前構建的向量索引中查找出最相似的結果,這樣就完成了一次以圖片內容為基礎的圖像檢索。選擇合適的向量檢索引擎非常重要。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

Faiss

Faiss (Facebook AI Similarity Search) 是Facebook AI 團隊開源的向量檢索庫引擎。初期我們也是選擇Faiss部署分布式服務,在多臺GPU服務器上部署特征向量搜索匹配服務,將搜索請求分發到每臺GPU子服務進行處理,然后將TOP N的相似結果數據匯總返回給調用方。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

在使用Faiss的過程中,我們也遇到了實際的困難。當然這并不是Faiss本身的問題,而是需要投入更多人力開發運維分布式系統才能匹配業務需求。

  • 穩定性較差:分布式GPU集群有5~6臺,當某一臺機器掛了會拉長整個接口響應時間,業務的表現就是搜圖服務等很久才有結果返回。
  • GPU資源不足:我們采用的是最基礎的暴力匹配算法,2億個256維特征向量需要全部加載到顯存,對線下GPU資源壓力很大。
  • 運維成本高:特征庫分片完全手動運維,管理比較繁瑣。數據分片分布式部署在多個GPU節點,增量分片數據超過GPU顯存,需要手動切片到新的GPU節點。
  • 帶寬爭搶:圖片識別服務和以圖搜圖服務都部署在線下機房,共享300Mb機房到阿里云的專線帶寬,批量圖片識別服務占用大帶寬場景下會直接導致人機交互的圖搜響應時間延長。
  • 特定場景下召回結果集不足:因為特征庫比較大,我們人工將特征庫拆成20個分片部署在多臺GPU服務器上,但由于Faiss限制每個分片只能返回1024召回結果集,不滿足某些場景的業務需求。

Proxima

Proxima是阿里達摩院自研的向量檢索引擎(https://developer.aliyun.com/article/782391),實現了對大數據的高性能相似性搜索,也集成在我們之前在用的阿里云托管版的ElasticSearch。功能和性能上與Faiss相比各有千秋,主要是針對Faiss使用上的困難,ElasticSearch + Proxima幫助我們解決了。

  • 穩定性高:開箱即用的產品服務SLA由阿里云保障,多節點部署的高可用架構。到目前為止,極少碰到接口超時問題
  • 算法優化:基于圖的HNSW算法不需要GPU,且與Proxima集成做了工程優化,性能有很大的提升(1000萬條數據召回只需要5毫秒)。目前業務發展特征向量已經增長到3億。
  • 運維成本低:分片基于ES引擎,數據量大的情況下直接擴容ElasticSearch計算節點就可以
  • 無帶寬爭搶:以圖搜圖的服務直接部署在云上,不占用專線帶寬,圖搜場景下沒有再出現超時查詢告警
  • 召回結果集滿足業務需求:Proxima也是基于segment分片取Top N相似,聚合后再根據標簽進行過濾。因為segment較多,能搜索到的數據量就比原先多很多。

技術架構升級展望

OLAP分析場景優化迭代

隨著數據量的不斷增長以及業務需求的不斷變化,OLAP分析場景越來越復雜,對算法和技術方案選型要求越來越高。舉個業務場景的例子:

10萬博主發布的圖片數量有1億多,用戶可以對博主進行關注訂閱,關注上限是2000個博主。用戶關注的2000個博主對應的圖片量級會在200萬左右。需要對用戶關注的圖片進行實時多條件統計分析(每個用戶關注博主不同)

以上例子在使用Elasticsearch實現查詢的時候需要9秒,顯然不滿足業務需要。那有沒有更好的方案呢?近期在調研完Clickhouse之后,對數據進行預處理產生大寬表再查詢,查詢時延已經降低到2秒以內,很好的滿足了業務需求。阿里云Clickhouse開箱即用,降低業務試錯成本,幫助我們快速響應業務需求。

規范數據建模和數據治理

目前DataWorks主要是用來做數據集成和任務調度,也有些少量的基于規則判斷數據質量,團隊內部的約定更多的是文檔化的開發規范,缺乏一些有效工具的輔助。隨著業務場景越來越復雜,集成的數據源越來越豐富,數據開發人員也越來越多,制定全部門統一的開發規范非常必要。DataWorks的數據建模通過工具和流程建立數據標準,可以實現結構化有序的統一管理。數據治理模塊可以通過配置檢查項檢測不符合數據規范的開發流程,基于多項治理項的健康分度量項目健康度以及治理成效。目前我們正在結合自己的業務試用數據建模和數據治理,期待能幫助我們更好的管理數據,實現數據價值的最大化。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

圖搜方案進階合作

在服裝行業領域圖片識別和以圖搜圖是我們的核心競爭力。阿里云機器學習PAI也提供了相似圖匹配的圖像檢索解決方案(https://help.aliyun.com/document_detail/313270.html)只需要配置原始圖像數據,無需標注就可以在線構建模型,這點對我們來說比較有吸引力,后續可以考慮進行測試對比,展開在服裝圖片建模領域的合作。

阿里云大數據助力知衣科技打造AI服裝行業核心競爭力

 

來源:業界供稿

(0)
上一篇 2022年9月22日 15:52
下一篇 2022年9月22日 15:52
欧美优质美女网站_国产大片精品免费永久看nba_亚洲自拍与偷拍_精品久久久久久久久久久院品网_中文字幕日韩一区二区_欧美中文字幕在线_美女一区二区久久_夜夜嗨av一区二区三区免费区 _欧美一区二区在线不卡_日韩三级电影网址
国产白丝网站精品污在线入口| 一区二区三区日韩在线观看| 成人午夜视频福利| 国产一区在线不卡| 久久99国内精品| 全国精品久久少妇| 日韩国产一区二| 日韩中文欧美在线| 亚洲人被黑人高潮完整版| 欧美精品18+| 欧美一区二区精品久久911| 欧美精品三级在线观看| 91精品欧美一区二区三区综合在| 欧美日韩一区二区在线观看| 欧美日韩一级二级| 欧美一卡二卡三卡四卡| 欧美va亚洲va香蕉在线| xvideos.蜜桃一区二区| 久久这里只精品最新地址| 久久久久久久av麻豆果冻| 国产精品免费免费| 亚洲午夜在线电影| 日本不卡的三区四区五区| 毛片一区二区三区| 懂色av一区二区三区蜜臀| av高清不卡在线| 欧美日韩另类一区| 欧美精品一区二区三区在线| 亚洲国产经典视频| 亚洲成在线观看| 国产综合色产在线精品| 日本电影欧美片| 宅男在线国产精品| 亚洲欧洲精品天堂一级| 三级精品在线观看| 成人午夜视频网站| 日韩你懂的在线观看| 综合欧美亚洲日本| 久久99精品久久久久久| 日本韩国欧美三级| 中文欧美字幕免费| 有码一区二区三区| 国产在线麻豆精品观看| 大尺度一区二区| 欧美一区二区三区播放老司机| 中文字幕综合网| 无吗不卡中文字幕| 成a人片亚洲日本久久| 欧美大片在线观看| 婷婷激情综合网| 99久久er热在这里只有精品66| 欧美午夜免费电影| 亚洲另类一区二区| 成人做爰69片免费看网站| 欧美一个色资源| 自拍偷拍亚洲激情| www.欧美.com| 国产精品丝袜91| 久久99精品国产.久久久久| 欧美日韩高清在线| 亚洲国产日韩a在线播放| 色综合久久综合| 国产精品福利影院| 不卡视频在线观看| 国产精品久久毛片av大全日韩| 国产在线观看一区二区| 精品少妇一区二区三区视频免付费 | 99热99精品| 亚洲国产高清aⅴ视频| 国产精品亚洲视频| 久久精品这里都是精品| 国产一区二区久久| 国产日韩亚洲欧美综合| 国产成人免费视频精品含羞草妖精| 欧美日本免费一区二区三区| 亚洲成av人影院| 91精品国产福利在线观看| 麻豆精品视频在线观看| 日韩美女在线视频| 国产精品系列在线观看| 国产精品沙发午睡系列990531| 精品在线一区二区| 欧美精品一区二区三| 成人一级视频在线观看| 一区二区三区久久久| 日韩欧美一区二区视频| gogo大胆日本视频一区| 亚洲成人av一区| 久久久久久99久久久精品网站| 99视频一区二区| 日本特黄久久久高潮| 精品电影一区二区三区| 91一区二区在线| 免费成人av资源网| 日韩美女久久久| 26uuu精品一区二区在线观看| 福利91精品一区二区三区| 亚洲一区二区高清| 国产三区在线成人av| 欧美午夜影院一区| 亚洲电影一区二区三区| 久久久噜噜噜久噜久久综合| 欧洲一区二区三区免费视频| 激情六月婷婷久久| 亚洲一区二区欧美日韩| 国产精品久久夜| wwwwxxxxx欧美| 色综合天天综合网天天看片| 老司机精品视频在线| 亚洲最大的成人av| 亚洲欧洲无码一区二区三区| 亚洲精品一线二线三线 | 国产在线视视频有精品| 天天av天天翘天天综合网 | 欧美久久久影院| 91在线免费看| www.99精品| 高清在线观看日韩| 久久不见久久见免费视频7| 亚洲高清在线视频| 一区二区三区成人| 亚洲码国产岛国毛片在线| 国产精品久久久一本精品 | 欧美老年两性高潮| 欧美丰满一区二区免费视频| 欧美日韩一区二区欧美激情| 色婷婷激情久久| 国产乱码精品1区2区3区| 国产综合色产在线精品| 国产剧情在线观看一区二区| 国产在线播精品第三| 国产精一区二区三区| 成人免费视频视频在线观看免费 | 亚洲二区在线观看| 亚洲成在线观看| 91精品国产色综合久久ai换脸| 久久婷婷国产综合国色天香| 久久91精品久久久久久秒播| 亚洲三级视频在线观看| 亚洲精品久久嫩草网站秘色| 午夜视频一区二区| 精品一区二区三区在线播放视频| 国产91丝袜在线播放0| 一本到不卡免费一区二区| 在线成人av网站| 久久久91精品国产一区二区三区| 国产精品婷婷午夜在线观看| 午夜电影一区二区| 成人一区二区三区视频在线观看| 在线观看视频一区| 久久精品在线免费观看| 亚洲国产中文字幕在线视频综合| 国产一区二区在线观看免费| 欧美视频一区在线| 国产精品午夜免费| 韩国午夜理伦三级不卡影院| 欧美亚洲动漫另类| 国产精品伦理在线| 国模无码大尺度一区二区三区| 欧美亚洲日本国产| 亚洲色图一区二区| 国产盗摄视频一区二区三区| 91精品国产麻豆| 亚洲国产欧美日韩另类综合 | 国产资源在线一区| 91黄色免费网站| 国产精品蜜臀av| 国产91在线观看丝袜| 欧美成人猛片aaaaaaa| 午夜精品久久久久久久| 色狠狠一区二区| 国产精品国产三级国产a| 黄色资源网久久资源365| 91.xcao| 一区二区三国产精华液| 99在线热播精品免费| 国产精品国产三级国产普通话三级 | 在线视频一区二区三区| 亚洲男人天堂av网| 99久久免费精品高清特色大片| 国产精品色哟哟| 成人中文字幕电影| 国产精品每日更新| 99在线精品观看| 亚洲精品国产精品乱码不99| 日本丰满少妇一区二区三区| 亚洲一区二区高清| 日韩一级大片在线| 国产精品一区在线观看乱码| 久久精品亚洲精品国产欧美| 国产精品1区二区.| 亚洲四区在线观看| 欧美色精品在线视频| 日韩影视精彩在线| 久久国产生活片100| 在线视频中文字幕一区二区| 天天做天天摸天天爽国产一区| 欧美成人vps| av一区二区三区四区| 亚洲国产精品一区二区久久恐怖片|