推荐标签
#python#coronavirus#nlp#covid-19#annotation-tool#opendata#data#datasets#natural-language-processing#machine-learning该分类下开源项目
awesome-public-datasets - 收集了各种类别的开源数据,包括但不限于经济、农业、生物、民生、气象、数据安全等等
OpenRefine is a free, open source power tool for working with messy data and improving it
翻译 - OpenRefine是一个免费的开源强大工具,用于处理混乱的数据并对其进行改进
🤗 The largest hub of ready-to-use NLP datasets for ML models with fast, easy-to-use and efficient data manipulation tools
翻译 - 🤗 PyTorch,TensorFlow,NumPy和Pandas中用于自然语言处理以及其他功能的快速,高效,开放式数据集和评估指标
Fastest unstructured dataset management for TensorFlow/PyTorch. Stream data real-time & version-control it. http://activeloop.ai
翻译 - 访问和管理PyTorch和TensorFlow数据集的最快方法。轻松构建可伸缩的数据管道。Leading Data 2.0 http://activeloop.ai
Connect APIs, remarkably fast. Free for developers.
翻译 - 无服务器集成和计算平台。开发人员免费。
Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models,corpus and leaderboard
翻译 - 汉语语言理解评估基准:数据集,基线,预训练模型,语料库和排行榜
暴力破解数据库 - 密码字典