├── LICENSE
└── README.md
/LICENSE:
--------------------------------------------------------------------------------
1 | MIT License
2 |
3 | Copyright (c) 2019 Kyon Huang
4 |
5 | Permission is hereby granted, free of charge, to any person obtaining a copy
6 | of this software and associated documentation files (the "Software"), to deal
7 | in the Software without restriction, including without limitation the rights
8 | to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
9 | copies of the Software, and to permit persons to whom the Software is
10 | furnished to do so, subject to the following conditions:
11 |
12 | The above copyright notice and this permission notice shall be included in all
13 | copies or substantial portions of the Software.
14 |
15 | THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16 | IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17 | FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18 | AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19 | LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20 | OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21 | SOFTWARE.
22 |
--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
1 |
AI Research Tools
2 |
3 |
4 |
5 |
6 |
7 |
8 | > * 推荐一些我喜欢的科研工具(有些限定于 AI 领域)
9 | > * 标记【待尝试】的是我还未使用过但感觉比较有用的工具,会尽快尝试并根据体验决定是否保留
10 | > * 请通过 issues 等方式向我推荐您觉得好用的但不在此清单上的 AI 领域科研工具,感谢
11 |
12 | ## 目录
13 |
14 | - [趋势关注](#趋势关注)
15 | - [RSS 阅读器](#rss-阅读器)
16 | - [论文查找](#论文查找)
17 | - [搜索引擎](#搜索引擎)
18 | - [arXiv 相关](#arxiv-相关)
19 | - [代码实现查找](#代码实现查找)
20 | - [论文阅读](#论文阅读)
21 | - [查阅下载](#查阅下载)
22 | - [文献管理](#文献管理)
23 | - [阅读助手](#阅读助手)
24 | - [文献翻译](#文献翻译)
25 | - [笔记工具](#笔记工具)
26 | - [编码实验](#编码实验)
27 | - [Pytorch 相关](#pytorch-相关)
28 | - [功能配置封装](#功能配置封装)
29 | - [项目参考](#项目参考)
30 | - [项目管理](#项目管理)
31 | - [风格指南](#风格指南)
32 | - [项目模板](#项目模板)
33 | - [神经网络分析器](#神经网络分析器)
34 | - [可视化](#可视化)
35 | - [实验记录](#实验记录)
36 | - [数据集查找](#数据集查找)
37 | - [数据集下载](#数据集下载)
38 | - [特征工程](#特征工程)
39 | - [超参搜索](#超参搜索)
40 | - [论文写作](#论文写作)
41 | - [LaTeX 模板](#latex-模板)
42 | - [LaTeX 编辑器](#latex-编辑器)
43 | - [语言表达](#语言表达)
44 | - [搭配查找](#搭配查找)
45 | - [句式推荐](#句式推荐)
46 | - [写作检查](#写作检查)
47 | - [公式编辑](#公式编辑)
48 | - [表格转 LaTeX](#表格转-latex)
49 | - [绘制示意图](#绘制示意图)
50 | - [绘图工具](#绘图工具)
51 | - [绘图参考](#绘图参考)
52 | - [PPT 插件](#ppt-插件)
53 | - [图片转换](#图片转换)
54 | - [图片休整](#图片休整)
55 | - [论文投递](#论文投递)
56 | - [会议期刊查找筛选](#会议期刊查找筛选)
57 | - [匿名链接](#匿名链接)
58 | - [arXiv 提交](#arxiv-提交)
59 | - [代码开源](#代码开源)
60 | - [其他](#其他)
61 | - [专利检索](#专利检索)
62 | - [专注工作](#专注工作)
63 | - [白噪声 / 音乐](#白噪声--音乐)
64 |
65 | ## 趋势关注
66 |
67 | ### RSS 阅读器
68 |
69 | * [irreader 阅读器](http://irreader.fatecore.com/):这是我现在在使用的 RSS 阅读器。一个非常大的优点是,对于一些没有提供 RSS 订阅源的网站,irreader 可以自定义 RSS 订阅源。另外,订阅的 RSS 更新时,有弹窗提醒。还有一个我暂时用不到的功能是,irreader 同时支持订阅播客和播放有声媒体。
70 |
71 | ## 论文查找
72 |
73 | ### 搜索引擎
74 |
75 | 一般来说,当我需要根据论文标题或其他信息查找 PDF 文件时,我会首选使用 dblp(检索结果清晰,无需科学上网)。对于某些特殊情况,我会再使用 Google Scholar。
76 |
77 | * [dblp: computer science bibliography](https://dblp.org/):专为 CS 设计的论文查询网站,收录比较顶级并可以被检索到的论文。可以根据会议、期刊等分类查询作者的论文,想搜一个计算机会议的所有文章时好用。
78 |
79 | * [Google scholar](https://scholar.google.com/schhp?hl=zh-CN):除开搜索论文之外,可以在这里查看论文统计和引用参考文献,还能通过关注作者或者论文获得新论文更新提醒,以及利用自动化推荐来提供一个基本库。
80 |
81 | * [Semantic scholar](https://www.semanticscholar.org/):可以结合外部材料整合进行论文的语义分析。功能包括:展示引用和参考文献、度量论文影响力、展示论文图表、自动生成关键词(根据标题)、分析作者、在互联网寻找额外资源(例如,相关 youtube 视频),以及推荐论文。
82 |
83 | ### arXiv 相关
84 |
85 | * [arXiv](https://arxiv.org/): 论文预印本收录网站。
86 |
87 | * [arXiv-sanity](http://arxiv-sanity.com/):在功能上相比于 arXiv 有很大的改进,包括在浏览中显示摘要、评论和非常基本的社交、推荐、库功能。搜索也更好用。
88 |
89 | * [Semantic Sanity: A Personalized Adaptive Feed](https://s2-sanity.apps.allenai.org):创建自己的个性化 arXiv 选读 Feed。创建每个 Feed 时,会让您先选择几篇论文,然后根据这几篇论文开始推荐,对于推荐结果可以点赞或者不喜欢来帮助调整推荐结果。
90 |
91 | * [Paper Digest – AI for tracking and summarizing papers](https://www.paperdigest.org/): 提供邮件订阅前一天出的论文的列表,附有每篇论文的一句话总结。对我更重要的是这个网站也会在每个顶会论文全部公布时进行整理。
92 |
93 | ### 代码实现查找
94 |
95 | * [Papers With Code](https://paperswithcode.com/):自动把论文连接到实现代码的 GitHub 资源库和数据集,并根据 GitHub 的收藏量排序。展示各任务上的 SOTA 以供比较。
96 |
97 | * [labmlai/annotated_deep_learning_paper_implementations](https://github.com/labmlai/annotated_deep_learning_paper_implementations):很多算法的 PyTorch 实现,带有在线版的注释。缺点是展示的部分不是从头实现,一部分代码放在他们自己的包里了。
98 |
99 | ## 论文阅读
100 |
101 | ### 查阅下载
102 |
103 | * [SCI-Hub 科研论文全文下载可用网址](http://tool.yovisun.com/scihub/)
104 |
105 | ### 文献管理
106 |
107 | * [Mendeley](https://www.mendeley.com):我目前使用这个。支持 web、PC、Mac 和移动手机等多个平台,可以直接注释和高亮显示 PDF,有限额的免费云存储。
108 |
109 | * [Zotero](https://www.zotero.org/):能够对文献数据库网页中的文献题录直接抓取,常与[坚果云](https://www.jianguoyun.com/)配合使用,来实现文献管理多端同步(支持MacOS、Windows、iPad、Linux、iOS)。
110 |
111 | ### 阅读助手
112 |
113 | * [Kimi Chat](https://kimi.moonshot.cn/):类 ChatPGT 产品,大伙应该都比较熟悉了。
114 |
115 | * [Cool Papers](https://papers.cool/):苏剑林大佬开发的刷论文网站。可根据 [README](https://github.com/bojone/papers.cool) 自行探索使用。
116 |
117 | ### 文献翻译
118 |
119 | * [CopyTranslator](https://copytranslator.github.io/):最大的优点在于有置顶、点按复制、监听剪贴板等功能,阅读文献配合使用时可以无缝切换,非常方便。
120 |
121 | * [Saladict 沙拉查词](https://saladict.crimx.com/):浏览器翻译插件,有非常丰富的设置来配合用户的使用习惯。除了官方文档,也可以看 [沙拉查词 + Alfred,打造最佳文献翻译体验!](https://zhuanlan.zhihu.com/p/113809716) 来了解。我还在探索如何在 Windows 系统上实现浏览器外翻译。
122 |
123 | ### 笔记工具
124 |
125 | 我之前使用[印象笔记](https://www.yinxiang.com/),但目前已经停用并考虑迁移。
126 |
127 | * [语雀](https://www.yuque.com/):非常轻量,我一般使用网页端。偶尔有些清单同步到手机端也很好用。新使用的同学可以填我的邀请码 QPFTUN 领取 30 天会员:kissing_heart:
128 |
129 | * [Notion](https://www.notion.so/):如果需要多人协作、项目管理,可能 Notion 会更合适。
130 |
131 | ## 编码实验
132 |
133 | ### Pytorch 相关
134 |
135 | #### 功能配置封装
136 |
137 | * [pytorch-lightning](https://github.com/williamFalcon/pytorch-lightning):将 PyTorch 开发中的各种通用配置(训练验证逻辑、超参搜索、分布式训练等)全部包装起来,以更高级的形式快速搭建模型。功能强大,有些复杂,正在摸索。[机器之心写的简介](https://mp.weixin.qq.com/s/5ueJvt1tcWW0wknpkM3WIg)
138 |
139 | #### 项目参考
140 |
141 | * [the-incredible-pytorch](https://github.com/ritchieng/the-incredible-pytorch):有关 PyTorch 的各种教程、项目、视频等资源。
142 |
143 | * [computervision-recipes](https://github.com/microsoft/computervision-recipes):微软出品,基于 PyTorch 的各种 CV 任务的教程。
144 |
145 |
146 |
147 | #### 项目管理
148 |
149 | * [torchtracer](https://oidiotlin.com/torchtracer/):一个管理 PyTorch AI 实验项目的工具,主要用于保存各类训练数据(模型 checkpoints、超参数组合、日志、loss 变化曲线图像等)。
150 |
151 | #### 风格指南
152 |
153 | * [pytorch-styleguide](https://github.com/IgorSusmelj/pytorch-styleguide):一份 PyTorch 的非官方风格指南和最佳实践总结。
154 |
155 | #### 项目模板
156 |
157 | * [Pytorch-Project-Template](https://github.com/moemen95/Pytorch-Project-Template):一个可扩展的 PyTorch 项目模板,包括图像分割、目标分类、GANs 和强化学习等实例。
158 |
159 | * [pytorch-template](https://github.com/lyakaap/pytorch-template):另一份 PyTorch 项目模板。
160 |
161 | #### 神经网络分析器
162 |
163 | * [torchinfo](https://github.com/TylerYep/torchinfo):打印 PyTorch 模型信息,包含模型每层的参数量、输出张量大小等。
164 |
165 | * [flops-counter.pytorch](https://github.com/sovrasov/flops-counter.pytorch):计算模型总共的 FLOPs(浮点运算数,理解为计算量,可以用来衡量算法/模型的复杂度)以及每层的占比。缺点是似乎不支持 RNN 相关层,另外打印下来的信息不是很方便看。
166 |
167 | #### 可视化
168 |
169 | * PyTorch 最新版本已经带有 tensorboard。[官方 tutorial](https://pytorch.org/tutorials/intermediate/tensorboard_tutorial.html)。
170 |
171 | * [visdom](https://github.com/facebookresearch/visdom):【待尝试】用于创建、组织和共享实时丰富数据可视化的灵活工具。
172 |
173 | * [Convolution Visualizer](https://ezyang.github.io/convolution-visualizer/index.html):如果卷积层配置比较复杂,不方便计算输出大小时,可以利用这个可视化工具辅助。
174 |
175 | ### 实验记录
176 |
177 | * [fitlog](https://github.com/fastnlp/fitlog):【待尝试】架构无关的实验记录工具,可以看[邱锡鹏老师在知乎写的介绍](https://www.zhihu.com/question/384519338/answer/1181186086)。
178 |
179 | ### 数据集查找
180 |
181 | * [Google Dataset Search](https://toolbox.google.com/datasetsearch)
182 |
183 | * [Data Search | Bifrost](https://datasets.bifrost.ai/):视觉数据集搜索。
184 |
185 | ### 数据集下载
186 |
187 | * [gdown](https://github.com/wkentaro/gdown):用于解决在 Google Drive 上下载大型数据集常发生的失败现象。
188 |
189 | ### 特征工程
190 |
191 | * [Featuretools](https://github.com/featuretools/featuretools):【待尝试】自动化特征工程库。
192 |
193 | ### 超参搜索
194 |
195 | * [optuna](https://github.com/optuna/optuna):自动超参数优化框架。
196 |
197 | * [microsoft/nni](https://github.com/microsoft/nni/blob/master/README_zh_CN.md):【待尝试】用于神经模型搜索和超参数调优的开源自动机器学习(AutoML)的工具包,支持绝大多数主流框架和运行环境。
198 |
199 | * [Hyperopt](http://hyperopt.github.io/hyperopt/):【待尝试】分布式异步超参数优化。看到知乎上有人推荐,不过根据文档来看,目前支持的优化算法只有两种,且不包括贝叶斯优化。
200 |
201 | * [BoTorch](https://github.com/pytorch/botorch):【待尝试】基于 PyTorch 的贝叶斯优化库。
202 |
203 | * [automl/Auto-PyTorch](https://github.com/automl/Auto-PyTorch):【待尝试】基于 PyTorch 的自动结构搜素和超参数搜索。
204 |
205 |
208 |
209 | ## 论文写作
210 |
211 | ### LaTeX 模板
212 |
213 | 包括论文、报告、海报等在内的各种 LaTeX 模板。
214 |
215 | * [Templates from Overleaf](https://www.overleaf.com/latex/templates)
216 |
217 | * [LaTeX Templates](http://www.latextemplates.com/)
218 |
219 | ### LaTeX 编辑器
220 |
221 | 多人协作推荐 Overleaf,也是我绝大多数时候的选择。单人项目可以使用 VSCode 进行离线的 LaTeX 写作,配合 Github 私有库进行版本管理。
222 |
223 | * [Overleaf](https://www.overleaf.com/):支持多人协作的**在线** LaTeX 编辑器。但是对网络连接有一定要求。
224 |
225 | ### 语言表达
226 |
227 | #### 搭配查找
228 |
229 | 可以看一下这篇文章的推荐:[有了这些网站,英文论文再也不难写了(15个英文论文写作辅助网站介绍和使用技巧) - 知乎](https://zhuanlan.zhihu.com/p/35396232)
230 |
231 | * [Linggle](https://linggle.com/):搜索最常出现的英文词语搭配。不确定自己的表达方式是否正确时使用。
232 |
233 | * [Corpus of Contemporary American English (COCA)](https://www.english-corpora.org/coca/):可以查词汇搭配的**美式**英语语料库,可以查看具体的用了这个词的句子。 [British National Corpus (BYU-BNC)](https://www.english-corpora.org/bnc/):英式英语的语料库,语料比美式的少一些
234 |
235 | * [Thesaurus](https://www.thesaurus.com/):将低端词汇转换为同义的高端词汇。
236 |
237 | * [易搜搭ESODA](http://www.esoda.org/):清华HCI Lab工作室出品的一款适合国人英语写作的词组搭配查询工具。可切换具体研究方向的论文语料库,展示相关的可替换用法,支持中英混搜。
238 |
239 | * [Words and phrases: frequency, genres, collocates, concordances, synonyms, and WordNet](https://www.wordandphrase.info/analyzeText.asp):用不同颜色区分高中低频词,展现代表文章类型的词汇,并归类出相关可替换的词。虽然说是英文写作措辞辅助工具,感觉最大的用途是学习相关领域论文常用的词汇和搭配。
240 |
241 | #### 句式推荐
242 |
243 | * [Academic Phrasebank](http://www.phrasebank.manchester.ac.uk/):学术用语库,告诉你各个章节适合用哪些句式搭配。
244 |
245 | #### 写作检查
246 |
247 | 除开各种类 ChatGPT 外的一些选择。请注意在线检测工具的泄露风险,谨慎处理关键文字。
248 |
249 | * [Grammarly](https://www.grammarly.com/):语法、句型、标点、选词检测修改,有浏览器插件。
250 |
251 | * [Nounplus.net](https://www.nounplus.net/):免费的在线英文语法检测。
252 |
253 |
254 |
255 | ### 公式编辑
256 |
257 | * [Mathpix](https://mathpix.com/):通过截取复杂数学方程式的截图将其转换为 LaTeX 代码。可以处理 PDF 的印刷体和照片中的手写公式等。
258 |
259 | * [MyScript Webdemo](https://webdemo.myscript.com/):Math 模块可以将手写公式转为 LaTeX 代码;同时,Diagram 模块可以将手绘的框图转化为工整的框图。
260 |
261 | * [Detexify LaTeX handwritten symbol recognition](http://detexify.kirelabs.org/classify.html): 忘记某些字符用 LaTeX 怎么表示时,可以在这个网站上通过手写来查询。
262 |
263 |
270 |
271 | ### 表格转 LaTeX
272 |
273 | * [Excel2LaTeX](https://ctan.org/tex-archive/support/excel2latex):用在 Excel 上的宏工具,能够将 Excel 表格转换为 LaTeX 代码,节省很多时间。能够满足大多数效果的转换,有些效果可能需要微调。
274 |
275 | ### 绘制示意图
276 |
277 | #### 绘图工具
278 |
279 | * Mac OS 系统可以使用 OmniGraffle。
280 |
281 | * PPT 通常是我的第一选择:入手快,种类多,自由度高,支持导出矢量图。
282 |
283 |
286 |
287 | #### 绘图参考
288 |
289 | * [Paper-Picture-Writing-Code](https://github.com/MLNLP-World/Paper-Picture-Writing-Code):基于 LaTex 的画图代码,包含折线图、柱状图、散点图、注意力可视化以及结构图。
290 |
291 | * [academic-drawing](https://github.com/xinychen/academic-drawing):Matlab/Python 绘图,主要用于画时序数据。
292 |
293 | * [awesome-latex-drawing](https://github.com/xinychen/awesome-latex-drawing):LaTeX 绘图,主要用于画贝叶斯网络、张量分解等。
294 |
295 | * [PlotNeuralNet](https://github.com/HarisIqbal88/PlotNeuralNet):Python 得到可用于 LaTeX 的图,主要画 CNN。
296 |
297 | #### PPT 插件
298 |
299 | * [IguanaTex](http://www.jonathanleroux.org/software/iguanatex/):帮助插入 LaTeX 公式的 PPT 插件。将输入的 LaTeX 代码转换为高质量的 png 或矢量图来插入。
300 |
301 | #### 图片转换
302 |
303 | 提供各种格式的图片的转换服务的网站很多。这里只是简单列举,你也可以通过搜索引擎来找到其他类似的网站。
304 |
305 | * [Convert PNG/JPEG (Raster) to EPS/PDF (Vector) Format](http://www.tlhiv.org/rast2vec/):将 jpg、png 格式的图片文件转换为 eps 文件。
306 |
307 | * [EPS到PDF转换器](https://convertio.co/zh/eps-pdf/):也可以将 eps 文件转换为别的格式的图片。
308 |
309 | #### 图片休整
310 |
311 | * [Crop PDF files online - PDF Tools](https://pdfresizer.com/crop):裁剪 pdf 文件的白边。
312 |
313 | * TexLive 自带了一些命令行工具:
314 | * 将 eps 转换为 pdf:`epstopdf `;
315 | * 自动裁剪 pdf 的白边:`pdfcrop `。
316 |
317 | ## 论文投递
318 |
319 | ### 会议期刊查找筛选
320 |
321 | * [ccf-deadlines](https://ccfddl.github.io/):可以根据研究方向和 CCF 等级来筛选本年度已经确定截稿日期的会议。对国内的同学比较友好。
322 |
323 | * [AI Conference Deadlines](https://aideadlin.es/):可以根据研究方向筛选会议。但是好像需要科学上网才能看到全部信息。
324 |
325 | * [Conference List](http://www.conferencelist.info/upcoming.html):根据截稿时间排序,过期的会议不在首页出现。有一页可以看每个研究方向有哪些会议,但是没有办法根据研究方向筛选还没过期的会议。
326 |
327 | * [Conference Partner (会伴)](http://www.myhuiban.com/):计算机最新国际会议和期刊列表。可以注册以关注会议或期刊。比较全,但目前信息更新不及时。
328 |
329 |
330 |
331 | ### 匿名链接
332 |
333 | 出于论文盲审考虑,有时候文件(如源码)链接需要是匿名的。有些人会选择在 Github 上创建一个匿名账号,但为每一个会议的每一篇论文都创建一个账号可能过于繁琐。我查到有一些工具支持匿名分享文件如下。
334 |
335 | * [Dropbox](https://www.dropbox.com/):应该是最常用的。
336 |
337 | * [Open Science Framework](http://help.osf.io/m/links_forks/l/783581-create-a-view-only-link-for-a-registration)
338 |
339 | * [Figshare](https://knowledge.figshare.com/articles/item/how-to-share-cite-or-embed-my-data)
340 |
341 | ### arXiv 提交
342 |
343 | * [Arxiv 论文提交流程——看这篇就够了](https://zhuanlan.zhihu.com/p/109405192):文章,用于了解将论文提交至 arXiv 上的流程。
344 |
345 | * [arxiv-latex-cleaner](https://github.com/google-research/arxiv-latex-cleaner):将论文的 LaTeX 代码清理为提交至 arXiv 上的要求。一个亮点是能够自动清理掉论文中所有被注释掉的内容。
346 |
347 | * [overleaf -> arxiv 丝滑提交过程](https://zhuanlan.zhihu.com/p/558225069):如果是使用 Overleaf(而不是在本地将 LaTeX 代码编译为论文),可以先参考本文下载合适的源码包,然后再考虑使用 arxiv-latex-cleaner。
348 |
349 | ### 代码开源
350 |
351 | 为已发表的论文提供清晰、可复现的代码能够有效推动领域发展。这里推荐一些对开源代码有帮助的工具。
352 |
353 | * [ReproducibilityChecklist-v2.0](https://www.cs.mcgill.ca/~jpineau/ReproducibilityChecklist.pdf):一份机器学习复现清单,列举了你应该提供哪些文件来增强你的论文的可复现性。
354 |
355 | * [pigar](https://github.com/Damnever/pigar):Python 项目 requirements 文件自动生成工具。
356 |
357 | ## 其他
358 |
359 | ### 专利检索
360 |
361 | * [Google Patents](https://iseex.github.io//2020-05/Google-Patents/):免费检索和下载中英文专利。具体可见 [Google Patents,免费检索和下载中英文专利的最佳工具!](https://iseex.github.io//2020-05/Google-Patents/)。
362 |
363 | ### 专注工作
364 |
365 | * [番茄·人生](http://www.tomatolife.cn/index.html):Windows PC 端待办事项软件,番茄工作法时钟。
366 |
367 | ### 白噪声 / 音乐
368 |
369 | * [Rainyscope rain simulator](https://rainyscope.com):下雨声。
370 |
371 | * [LofiGirl的音乐自习室](https://live.bilibili.com/27519423):Lo-Fi 音乐直播间。
--------------------------------------------------------------------------------