最新推荐
AI文字
AI工具
MCP Servers
AI教程
AI绘画
AI插件
AI音乐
数字人
行业报告
数据集
allenai/tulu-3-sft-olmo-2-mixture
allenai/tulu-3-sft-olmo-2-mixture是一个多语种文本数据集,包含丰富的对话示例,适用于自然语言处理和机器学习研究。
数据集
自然语言处理
多语种
dclm-baseline-1.0
dclm-baseline-1.0是由mlfoundations团队在Hugging Face平台上发布的一个数据集,用于机器学习基线模型的训练和评估。该数据集采用CC-BY-4.0许可协议。
机器学习
基线模型
数据集
FineWeb:高质量自然语言处理数据集
FineWeb 自然语言处理数据集 FineWeb数据集包含超过15万亿个经过清洗和去重的英文网页
FineWeb
自然语言处理
数据集