
Data Cleaning & Annotation Workflow是什么
Data Cleaning & Annotation Workflow是一款针对时间序列数据(如能源、制造业、气候数据)的清洗与标注工具,支持从Kaggle下载数据,并在data.smlcrm.com平台上进行标注。
由 Deyashmukh 开发 | 累计安装 399 次 | 开源协议:MIT-0
Data Cleaning & Annotation Workflow的主要功能
- 数据下载:从Kaggle平台下载所需的时间序列数据集。
- 数据清洗:自动处理缺失值、重复项、格式化等数据清洗任务。
- 数据标注:在data.smlcrm.com平台上进行数据标注,支持多种数据类型。
- 元数据配置:配置数据集的列类型、单位等元数据。
- 批量处理:支持批量处理多个数据集,提高工作效率。
如何使用Data Cleaning & Annotation Workflow
- 数据下载:在Kaggle上找到所需数据集,通过浏览器或Kaggle CLI下载。
- 数据清洗:运行清洗脚本,处理数据集中的缺失值、重复项等。
- 上传数据:将清洗后的数据集上传至data.smlcrm.com平台。
- 配置元数据:在平台上配置数据集的列类型、单位等元数据。
- 数据标注:在平台上进行数据标注工作。
Data Cleaning & Annotation Workflow的项目地址
- 项目官网:https://clawhub.ai/Deyashmukh/data-cleaning-annotation-workflow
Data Cleaning & Annotation Workflow的应用场景
- 能源行业:对电力消耗、公用事业等数据进行清洗和标注。
- 制造业:对工业流程、钢铁生产等数据进行清洗和标注。
- 气候研究:对二氧化碳排放、环境监测等数据进行清洗和标注。
奇绩Mapping工作流Skill
股票历史行情查询 - Chinese Stock Historical Data Query
Zeelin Social Watch
YouTube Transcript Extractor
YouTube Outliers & Niche Finder Data by TubeLab
Youtube Data
YouTube AI Videos
yahoo fetch data of stonks
xtdata
wikidata-query-skill
Wechat Local Data Reader
web3-data-skill
渝公网安备50011302222466号
暂无评论