「自學(xué)Python?一般人我還是勸你算了吧!」
在國(guó)內(nèi)知識(shí)分享平臺(tái)「知乎」上,這一吐槽話題獲得了超過(guò)2600次點(diǎn)贊,引發(fā)近600條討論。

從該話題下的高贊討論來(lái)看,多數(shù)人對(duì)Python的應(yīng)用性都持肯定態(tài)度,但在門(mén)檻上卻褒貶不一,有人認(rèn)為Python能夠讓新人很快入門(mén),從而在初始階段就獲得成就感,提升興趣度;而有人則堅(jiān)持長(zhǎng)遠(yuǎn)發(fā)展觀點(diǎn),認(rèn)為Python在語(yǔ)法上隱藏了大量概念,比如類型、多態(tài)應(yīng)用原理等,如果基本功不扎實(shí),即便是新手入了門(mén),也難以進(jìn)一步深入。
作為目前被廣泛使用的解釋型編程語(yǔ)言,Python憑借多種強(qiáng)大的算法和模型,和數(shù)據(jù)靈活整合分析與建模等功能,近年來(lái)風(fēng)頭一時(shí)無(wú)兩。根據(jù)2021年TIOBE 編程語(yǔ)言社區(qū)的排名數(shù)據(jù),Python以市場(chǎng)占比12.90%排名第一位,市場(chǎng)占比上升0.69%;從Python市場(chǎng)占比的歷史趨勢(shì)來(lái)看,從2014年開(kāi)始,Python市場(chǎng)占比就開(kāi)始逐年走高,至2022年,Python市場(chǎng)占比達(dá)到歷史最高峰。
但另一方面,Python在使用過(guò)程中一直存在門(mén)檻問(wèn)題,這導(dǎo)致企業(yè)內(nèi)除算法工程師之外的員工,很難深度應(yīng)用。
一般情況下,企業(yè)數(shù)據(jù)的采集、治理、分析、應(yīng)用往往都在安全權(quán)限的管控下有著既定流轉(zhuǎn)鏈路,各環(huán)節(jié)對(duì)應(yīng)不同崗位員工的工作要?jiǎng)t,但不同崗位工作交接的過(guò)程中,卻偶有出現(xiàn)能力“斷點(diǎn)”。
如,數(shù)據(jù)開(kāi)發(fā)一般會(huì)提供寬表來(lái)應(yīng)對(duì)前線業(yè)務(wù)的需求,但在部分情況下需要將數(shù)據(jù)做行列轉(zhuǎn)換,才能對(duì)數(shù)據(jù)進(jìn)行更進(jìn)一步分析,而這項(xiàng)操作能力對(duì)普通業(yè)務(wù)崗位員工來(lái)說(shuō),是一道“攔路虎”;即便是置身這一環(huán)節(jié)“專業(yè)對(duì)口”的算法工程師,也依舊面臨著另一個(gè)問(wèn)題:目前市場(chǎng)上缺少可以將臨時(shí)生產(chǎn)好的數(shù)據(jù)與可視化圖表聯(lián)動(dòng)的產(chǎn)品,但這恰巧又是數(shù)據(jù)能被后鏈路環(huán)節(jié)高效應(yīng)用的關(guān)鍵。
針對(duì)將數(shù)據(jù)挖掘與可視化圖表聯(lián)動(dòng),以及降低非算法工程師崗位對(duì)數(shù)據(jù)挖掘需求的理解門(mén)檻,火山引擎數(shù)智平臺(tái)VeDI旗下數(shù)智洞察DataWind,近期推出了升級(jí)功能:可視化建模。
這項(xiàng)新功能封裝了超過(guò)30類常見(jiàn)的AI算子能力,用戶僅需了解算法的作用,就可以通過(guò)配置化的方式配置算法算子的輸入和訓(xùn)練目標(biāo),完成模型訓(xùn)練,并根據(jù)配置的其他數(shù)據(jù)內(nèi)容快速得到預(yù)測(cè)結(jié)果。

過(guò)去,復(fù)雜算法模型往往需要通過(guò)Python才得以實(shí)現(xiàn),但現(xiàn)在通過(guò)DataWind同樣能夠完成搭建。
以電商企業(yè)場(chǎng)景為例,當(dāng)員工需要根據(jù)現(xiàn)有數(shù)據(jù)構(gòu)建「用戶回購(gòu)模型」時(shí),考慮整個(gè)過(guò)程需要經(jīng)過(guò)數(shù)據(jù)清洗、格式轉(zhuǎn)換之后采用梯度提升樹(shù)構(gòu)建,核心涉及的環(huán)節(jié)包括合并行、缺失值替換、one-hot編碼、梯度提升樹(shù)、聚合、提取字段總共6個(gè),因此通過(guò)DataWind可視化建模構(gòu)建的「用戶回購(gòu)模型」流程可以參考下圖:

可視化搭建的方式,一方面降低了非算法工程師對(duì)流程的理解成本,另一方面對(duì)算法工程師自身來(lái)說(shuō),操作也將更加簡(jiǎn)單便捷,進(jìn)一步提升工作效率。
而可視化建模只是DataWind近期功能升級(jí)的一個(gè)縮影,在今年更早之前,DataWind就已經(jīng)迎來(lái)協(xié)同層面大動(dòng)作,實(shí)現(xiàn)與飛書(shū)、企業(yè)微信等在線協(xié)同辦公I(xiàn)M工具全面協(xié)同,用戶通過(guò)飛書(shū)等就可以完成DataWind數(shù)據(jù)服務(wù)一鍵訂閱,隨時(shí)隨地查看數(shù)據(jù)、使用數(shù)據(jù)。

據(jù)了解,在歷經(jīng)字節(jié)跳動(dòng)內(nèi)部多業(yè)務(wù)多場(chǎng)景實(shí)踐之后,目前火山引擎的系列數(shù)智能力已經(jīng)通過(guò)DataWind等產(chǎn)品全面對(duì)外輸出,并在互聯(lián)網(wǎng)、汽車、零售、金融等多個(gè)行業(yè)在內(nèi)的數(shù)百家標(biāo)桿企業(yè)獲得應(yīng)用實(shí)效。