丝美导航 AI技能集 数据分析技能

Dataset Splitter

Dataset Splitter是一款图像数据集分割工具,支持随机、分层分割,并生成训练、验证、测试集。

标签:
分享到:

Dataset Splitter

Dataset Splitter是什么

Dataset Splitter是一款用于图像数据集分割的工具,适用于深度学习模型训练,支持随机、分层分割,并生成训练、验证、测试集,同时支持注释和YOLO格式输出。

Mingo-318 开发 | 累计安装 87 次 | 开源协议:MIT-0

Dataset Splitter的主要功能

  • 随机分割:随机打乱并分割数据集,确保数据集的随机性。
  • 分层分割:保持类别分布,适用于需要保持类别比例的场景。
  • 自定义比例:可配置训练、验证、测试集的比例,满足不同需求。
  • 注释支持:同时分割图像和相应的注释,方便后续处理。
  • YOLO格式:生成YOLO格式的数据集结构,适用于YOLO目标检测模型。
  • 可重复性:设置随机种子,确保分割结果的可重复性。

如何使用Dataset Splitter

  • 安装依赖:使用pip安装依赖库,如pillow。
  • 指定数据集路径:运行splitter.py脚本,指定图像数据集的路径。
  • 设置分割比例:使用--ratios参数设置训练、验证、测试集的比例。
  • 分割数据集:执行split命令,开始分割数据集。
  • 输出格式:可选设置输出格式,如YOLO格式。

Dataset Splitter的项目地址

  • 项目官网https://clawhub.ai/Mingo-318/dataset-splitter

Dataset Splitter的应用场景

  • 深度学习模型训练数据集的分割
  • 图像识别数据集的划分
  • 目标检测数据集的生成
  • 图像分类数据集的制备

相关导航