崗位職責(zé):
1、數(shù)據(jù)清洗與治理:
①負(fù)責(zé)公司核心業(yè)務(wù)系統(tǒng)內(nèi)部數(shù)據(jù)的全面清洗、校驗(yàn)和標(biāo)準(zhǔn)化工作,識(shí)別并處理數(shù)據(jù)中的缺失、錯(cuò)誤與不一致問(wèn)題。
②建立和維護(hù)長(zhǎng)效的數(shù)據(jù)清洗規(guī)則、流程與質(zhì)量標(biāo)準(zhǔn),提升核心數(shù)據(jù)資產(chǎn)的準(zhǔn)確性與可用性。
2、模型開(kāi)發(fā)與自動(dòng)化:
①設(shè)計(jì)并開(kāi)發(fā)數(shù)據(jù)清洗、分類與打標(biāo)模型,利用規(guī)則引擎與機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)數(shù)據(jù)的智能歸類與信息提取。
②應(yīng)用自然語(yǔ)言處理(NLP)等技術(shù),對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行智能解析,挖掘深層信息。
③構(gòu)建數(shù)據(jù)質(zhì)量監(jiān)控與異常檢測(cè)模型,實(shí)現(xiàn)數(shù)據(jù)問(wèn)題的主動(dòng)發(fā)現(xiàn)與預(yù)警。
3、數(shù)據(jù)價(jià)值挖掘與分析:
①基于治理后的高質(zhì)量數(shù)據(jù),進(jìn)行深度分析與挖掘,揭示業(yè)務(wù)規(guī)律、風(fēng)險(xiǎn)點(diǎn)和優(yōu)化機(jī)會(huì)。
②通過(guò)建立數(shù)據(jù)分析模型,為業(yè)務(wù)決策、產(chǎn)品優(yōu)化、風(fēng)險(xiǎn)管控等提供量化依據(jù)與數(shù)據(jù)支持。
4、數(shù)據(jù)產(chǎn)品與報(bào)告:
①開(kāi)發(fā)可視化的數(shù)據(jù)看板與自動(dòng)化報(bào)告,持續(xù)監(jiān)控?cái)?shù)據(jù)健康度并賦能業(yè)務(wù)團(tuán)隊(duì)。
②將核心數(shù)據(jù)模型與分析方法沉淀為可復(fù)用的數(shù)據(jù)工具或服務(wù)。
任職要求:
1、編程與工具:
熟練掌握 Python 進(jìn)行數(shù)據(jù)清洗、分析和建模,精通 Pandas, NumPy, Scikit-learn 等核心庫(kù)。
熟練使用 SQL,能夠進(jìn)行復(fù)雜的數(shù)據(jù)處理與提取。
具備使用數(shù)據(jù)可視化工具(如 Tableau, Power BI)的能力。
2、數(shù)據(jù)建模能力:
具備扎實(shí)的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)知識(shí),有實(shí)際的數(shù)據(jù)分類、聚類、自然語(yǔ)言處理(NLP)等項(xiàng)目經(jīng)驗(yàn)。
熟悉模型構(gòu)建的全流程,包括特征工程、模型訓(xùn)練、評(píng)估與優(yōu)化。
3、數(shù)據(jù)敏感度:
對(duì)數(shù)據(jù)有高度的敏感性和嚴(yán)謹(jǐn)性,具備優(yōu)秀的數(shù)據(jù)清洗和質(zhì)量控制能力。
4、加分項(xiàng):
有處理復(fù)雜B端業(yè)務(wù)系統(tǒng)數(shù)據(jù)(如供應(yīng)鏈、ERP、CRM等)經(jīng)驗(yàn)者優(yōu)先。
具備大數(shù)據(jù)處理經(jīng)驗(yàn)(如 Spark)者優(yōu)先。
5、綜合素質(zhì):
具備優(yōu)秀的邏輯分析能力和系統(tǒng)性解決問(wèn)題的能力。
具有良好的溝通能力和團(tuán)隊(duì)協(xié)作精神,能夠?qū)?fù)雜的技術(shù)問(wèn)題轉(zhuǎn)化為清晰的業(yè)務(wù)語(yǔ)言。
對(duì)工作認(rèn)真負(fù)責(zé),有強(qiáng)烈的自驅(qū)力,樂(lè)于探索數(shù)據(jù)背后的業(yè)務(wù)價(jià)值。