数据仓库

该分类下的开源项目

#数据仓库#  awesome-public-datasets - 收集了各种类别的开源数据,包括但不限于经济、农业、生物、民生、气象、数据安全等等

50.63 k
awesomedata/awesome-public-datasets

#自然语言处理#  🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools

翻译🤗 PyTorch,TensorFlow,NumPy和Pandas中用于自然语言处理以及其他功能的快速,高效,开放式数据集和评估指标

Python14.14 k
huggingface/datasets

#数据仓库#  OpenRefine(原名Google Refine) 是一个强大的数据清洗和转换工具

Java9.04 k
OpenRefine/OpenRefine

#计算机科学#  Open source annotation tool for machine learning practitioners.

翻译机器学习从业者的开源文本注释工具。

Python6.76 k
doccano/doccano

#数据仓库#  An open source multi-tool for exploring and publishing data

翻译一个用于探索和发布数据的开源多功能工具

Python6.15 k
simonw/datasette

#计算机科学#  Dataset format for AI. Build, manage, & visualize datasets for deep learning. Stream data real-time to PyTorch/TensorFlow & version-control it. https://activeloop.ai

翻译访问和管理PyTorch和TensorFlow数据集的最快方法。轻松构建可伸缩的数据管道。Leading Data 2.0 http://activeloop.ai

Python4.06 k
activeloopai/Hub

#数据仓库#  数据接口:百度、谷歌、头条、微博指数,宏观数据,利率数据,货币汇率,千里马、独角兽公司,新闻联播文字稿,影视票房数据,高校名单,疫情数据…

Python1.06 k
justinzm/gopup

#数据仓库#  Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models,corpus and leaderboard

翻译汉语语言理解评估基准:数据集,基线,预训练模型,语料库和排行榜

Python841
ChineseGLUE/ChineseGLUE

#数据仓库#  An extension of Open3D to address 3D Machine Learning tasks

翻译An extension of Open3D to address 3D Machine Learning tasks

Python738
isl-org/Open3D-ML

#数据仓库#  暴力破解数据库 - 密码字典

675
duyet/bruteforce-database