数据仓库

该分类下开源项目

  awesome-public-datasets - 收集了各种类别的开源数据,包括但不限于经济、农业、生物、民生、气象、数据安全等等

37.4 k
awesomedata/awesome-public-datasets

  OpenRefine is a free, open source power tool for working with messy data and improving it

翻译OpenRefine是一个免费的开源强大工具,用于处理混乱的数据并对其进行改进

Java7.9 k
OpenRefine/OpenRefine

  🤗 The largest hub of ready-to-use NLP datasets for ML models with fast, easy-to-use and efficient data manipulation tools

翻译🤗 PyTorch,TensorFlow,NumPy和Pandas中用于自然语言处理以及其他功能的快速,高效,开放式数据集和评估指标

Python6.84 k
huggingface/datasets

  An open source multi-tool for exploring and publishing data

翻译一个用于探索和发布数据的开源多功能工具

Python4.34 k
simonw/datasette

  Open source text annotation tool for machine learning practitioner.

翻译机器学习从业者的开源文本注释工具。

Python4.34 k
doccano/doccano

  Fastest unstructured dataset management for TensorFlow/PyTorch. Stream data real-time & version-control it. http://activeloop.ai

翻译访问和管理PyTorch和TensorFlow数据集的最快方法。轻松构建可伸缩的数据管道。Leading Data 2.0 http://activeloop.ai

Python2.57 k
activeloopai/Hub

  Connect APIs, remarkably fast. Free for developers.

翻译无服务器集成和计算平台。开发人员免费。

JavaScript1.49 k
PipedreamHQ/pipedream

  数据接口:百度、谷歌、头条、微博指数,宏观数据,利率数据,货币汇率,千里马、独角兽公司,新闻联播文字稿,影视票房数据,高校名单,疫情数据…

Python1.06 k
justinzm/gopup

  Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models,corpus and leaderboard

翻译汉语语言理解评估基准:数据集,基线,预训练模型,语料库和排行榜

Python841
ChineseGLUE/ChineseGLUE

  暴力破解数据库 - 密码字典

675
duyet/bruteforce-database

©2020 GitHub中文社区 - 🔨建设中
📧 admin@githubs.cn  - 论坛 - GitHub官网 - GitList