AI 日历

AI 日历

研究方向 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024
计算机视觉-CNN AlexNet   1.VGG 2.GoogleNet ResNet   MobileNet   EfficientNet   Non-deep networks      
计算机视觉 - 对比学习             1.InstDisc 2.CPC 1.InvaSpread 2.CMC 3.MoCov1 1.SimCLRv1 2.MoCov2 3.SimCLRv2 4.BYOL 5.SWaV 6.SimSiam 1.MoCov3 2.DINO      
计算机视觉 - Transformer                 ViT 1.Swin Transformer 2.MLP-Mixer 3.MAE      
生成模型     GAN DCGAN 1.pix2pix 2.SRGAN 1.WGAN 2.CycleGAN StyleGAN StyleGAN2 DDPM 1.Improved DDPM 2.Guided Diffusion Models 3.StyleGAN3 1.Stable Diffusion 2.DALL.E 2    
计算机视觉 - Object Detection     R-CNN 1.Fast R-CNN 2.Faster R-CNN 1.SSD 2.YOLO 1.Mask R-CNN 2.YOLOv2 YOLOv3 CenterNet DETR        
计算机视觉 - 视频理解     1.DeepVideo 2.Two-stream 3.C3D Beyond-short-snippets 1.Convolutional fusion 2.TSN 1.I3D 2.R2+1D 3.Non-local SlowFast     TimeSformer      
自然语言处理 - Transformer           Transformer 1.GPT 2.BERT GPT-2 GPT-3   chatGPT    
多模态学习                   1.CLIP 2.ViLT 3.ViLD 4.GLIP 5.CLIP4Clip 6.ActionCLIP 7.PointCLIP 1.LSeg 2.GroupViT 3.CLIPasso 4.DepthCLIP GPT-4  
多模态学习2           1. bert-Google-文本无监督模型 2. UNITER-BAIDU-视觉端使用检测框做多模态学习 1. OSCAR-MicroSoft-视觉端使用检测框做多模态学习 2. ViT-Google-有监督视觉Transformer 1. Beit-Microsoft-利用dVAE把连续特征变成离散的token,对mask掉的token做预测 2. MAE-Meta-带掩码的视觉自编码模型 3. CLIP-OPENAI-文本和图像做对比学习,大力出奇迹 4. ViLT-NAVER AI lab-剔除目标检测,增加模态融合 5. ALBEF-SalesForce-多模态融合之前,对齐模态特征,ITC+ITM+MLM 6. VLMo-Microsoft-混合模态专家结构,不同模态共享权重,分阶段训练 7. SimVLM-Google-原始结构中直接包含encoder,decoder,但模态,多模态 1. Beit-v2-Microsoft-优化了beit中视觉标志的生成结构 2. VL-Beit -Microsoft-但模态和多模态结构共享,对数据masked预测 3. FLIP-Meta-带掩码图像和文本的对比学习 4. CoCa-Google-文本段重用decoder训练,提升训练效率 ITC+LM 5. BLiP-SaleForce-通过decoder生成字幕,字幕器和过滤器清洗数据,文本decoder encoder共享权重,ITC+ITM+LM 6. BeiT-v3 - Microsoft - 所有技术大一统   GPT-4o  

深度学习论文精读 copy from paper reading

录制完成的论文

日期 标题 封面 时长 视频(播放数)
3/30/23 GPT-4 1:20:38 bilibili
3/23/23 大模型时代下做科研的四个思路 1:06:29 bilibili
3/10/23 Anthropic LLM 1:01:51 bilibili
1/20/23 Helm 全面语言模型评测 1:23:37 bilibili
1/11/23 多模态论文串讲·下 1:03:29 bilibili
12/29/22 Instruct GPT 1:07:10 bilibili
12/19/22 Neural Corpus Indexer 文档检索 55:47 bilibili
12/12/22 多模态论文串讲·上 1:12:27 bilibili
11/14/22 OpenAI Whisper 精读 1:12:16 bilibili
11/07/22 在讲 OpenAI Whisper 前先做了一个剪视频小工具 23:39 bilibili
10/23/22 Chain of Thought 论文、代码和资源 33:21 bilibili
9/17/22 CLIP 改进工作串讲(下) 1:04:26 bilibili
9/2/22 CLIP 改进工作串讲(上) 1:14:43 bilibili
7/29/22 ViLT 论文精读 1:03:26 bilibili
7/22/22 理由、论据和担保【研究的艺术·四】 44:14 bilibili
7/15/22 如何讲好故事、故事里的论点【研究的艺术·三】 43:56 bilibili
7/8/22 DALL·E 2 逐段精读 1:27:54 bilibili
7/1/22 明白问题的重要性【研究的艺术·二】 1:03:40 bilibili
6/24/22 跟读者建立联系【研究的艺术·一】 45:01 bilibili
6/17/22 Zero 逐段精读 52:21 bilibili
6/10/22 DETR 逐段精读 54:22 bilibili
6/3/22 Megatron LM 逐段精读 56:07 bilibili
5/27/22 GPipe 逐段精读 58:47 bilibili
5/5/22 Pathways 逐段精读 1:02:13 bilibili
4/28/22 视频理解论文串讲(下) 1:08:32 bilibili
4/21/22 参数服务器(Parameter Server) 逐段精读 1:37:40 bilibili
4/14/22 视频理解论文串讲(上) 51:15 bilibili
3/31/22 I3D 论文精读 52:31 bilibili
3/24/22 斯坦福 2022 年 AI 指数报告 精读 1:19:56 bilibili
3/17/22 AlphaCode 论文精读 44:00 bilibili
3/10/22 OpenAI Codex 论文精读 47:58 bilibili
zhihu
3/3/22 GPT, GPT-2, GPT-3 精读 1:29:58 bilibili
2/24/22 Two-Stream 逐段精读 52:57 bilibili
2/10/22 CLIP 逐段精读 1:38:25 bilibili
zhihu
2/6/22 你(被)吐槽过论文不够 novel 吗? 14:11 bilibili
zhihu
1/23/22 AlphaFold 2 精读 1:15:28 bilibili
zhihu
1/18/22 如何判断(你自己的)研究工作的价值 9:59 bilibili
zhihu
1/15/22 Swin Transformer 精读 1:00:21 bilibili
zhihu
1/7/22 指导数学直觉 52:51 bilibili
zhihu
1/5/22 AlphaFold 2 预告 03:28 bilibili
12/20/21 对比学习论文综述 1:32:01 bilibili
zhihu
12/15/21 MoCo 逐段精读 1:24:11 bilibili
zhihu
12/9/21 如何找研究想法 1 5:34 bilibili
12/8/21 MAE 逐段精读 47:04 bilibili
zhihu
11/29/21 ViT 逐段精读 1:11:30 bilibili
zhihu
11/18/21 BERT 逐段精读 45:49 bilibili
zhihu
11/9/21 GAN 逐段精读 46:16 bilibili
zhihu
11/3/21 零基础多图详解 图神经网络(GNN/GCN) 1:06:19 bilibili
zhihu
10/27/21 Transformer 逐段精读
(视频中提到的文献 1)
1:27:05 bilibili
zhihu
10/22/21 ResNet 论文逐段精读 53:46 bilibili
zhihu
10/21/21 撑起计算机视觉半边天的 ResNet 11:50 bilibili
zhihu
10/15/21 AlexNet 论文逐段精读 55:21 bilibili
zhihu
10/14/21 9年后重读深度学习奠基作之一:AlexNet 19:59 bilibili
zhihu
10/06/21 如何读论文 06:39 bilibili
zhihu

所有论文

包括已经录制完成和之后将要介绍的论文。选取的原则是10年内深度学习里有影响力文章(必读文章),或者近期比较有意思的文章。当然这十年里重要的工作太多了,不可能一一过一遍。在选取的时候我会偏向一些之前 直播课 中没讲到过的。 欢迎大家在 讨论区 里提供建(点)议(歌)。

总论文数 67,录制完成数 32

(这里引用采用的是 semanticscholar,是因为它提供 API 可以自动获取,不用手动更新。)

计算机视觉 - CNN

已录制 年份 名字 简介 引用
2012 AlexNet 深度学习热潮的奠基作 citation
  2014 VGG 使用 3x3 卷积构造更深的网络 citation
  2014 GoogleNet 使用并行架构构造更深的网络 citation
2015 ResNet 构建深层网络都要有的残差连接。 citation
  2017 MobileNet 适合终端设备的小CNN citation
  2019 EfficientNet 通过架构搜索得到的CNN citation
  2021 Non-deep networks 让不深的网络也能在ImageNet刷到SOTA citation

计算机视觉 - Transformer

已录制 年份 名字 简介 引用
2020 ViT Transformer杀入CV界 citation
2021 Swin Transformer 多层次的Vision Transformer citation
  2021 MLP-Mixer 使用MLP替换self-attention citation
2021 MAE BERT的CV版 citation

生成模型

已录制 年份 名字 简介 引用
2014 GAN 生成模型的开创工作 citation
  2015 DCGAN 使用CNN的GAN citation
  2016 pix2pix   citation
  2016 SRGAN 图片超分辨率 citation
  2017 WGAN 训练更加容易 citation
  2017 CycleGAN   citation
  2018 StyleGAN   citation
  2019 StyleGAN2   citation
  2020 DDPM Diffusion Models citation
  2021 Improved DDPM 改进的 DDPM citation
  2021 Guided Diffusion Models 号称超越 GAN citation
  2021 StyleGAN3   citation
2022 DALL.E 2 CLIP + Diffusion models,文本生成图像新高度 citation

计算机视觉 - Object Detection

已录制 年份 名字 简介 引用
  2014 R-CNN Two-stage citation
  2015 Fast R-CNN   citation
  2015 Faster R-CNN   citation
  2016 SSD Single stage citation
  2016 YOLO   citation
  2017 Mask R-CNN   citation
  2017 YOLOv2   citation
  2018 YOLOv3   citation
  2019 CenterNet Anchor free citation
2020 DETR Transformer citation

计算机视觉 - 对比学习

已录制 年份 名字 简介 引用
2018 InstDisc 提出实例判别和memory bank做对比学习 citation
2018 CPC 对比预测编码,图像语音文本强化学习全都能做 citation
2019 InvaSpread 一个编码器的端到端对比学习 citation
2019 CMC 多视角下的对比学习 citation
2019 MoCov1 无监督训练效果也很好 citation
2020 SimCLRv1 简单的对比学习 (数据增强 + MLP head + 大batch训练久) citation
2020 MoCov2 MoCov1 + improvements from SimCLRv1 citation
2020 SimCLRv2 大的自监督预训练模型很适合做半监督学习 citation
2020 BYOL 不需要负样本的对比学习 citation
2020 SWaV 聚类对比学习 citation
2020 SimSiam 化繁为简的孪生表征学习 citation
2021 MoCov3 如何更稳定的自监督训练ViT citation
2021 DINO transformer加自监督在视觉也很香 citation

计算机视觉 - 视频理解

已录制 年份 名字 简介 引用
2014 DeepVideo 提出sports1M数据集,用深度学习做视频理解 citation
2014 Two-stream 引入光流做时序建模,神经网络首次超越手工特征 citation
2014 C3D 比较深的3D-CNN做视频理解 citation
2015 Beyond-short-snippets 尝试使用LSTM citation
2016 Convolutional fusion 做early fusion来加强时空间建模 citation
2016 TSN 超级有效的视频分段建模,bag of tricks in video citation
2017 I3D 提出Kinetics数据集,膨胀2D网络到3D,开启3D-CNN时代 citation
2017 R2+1D 拆分3D卷积核,使3D网络容易优化 citation
2017 Non-local 引入自注意力做视觉问题 citation
2018 SlowFast 快慢两支提升效率 citation
2021 TimeSformer 视频中第一个引入transformer,开启video transformer时代 citation

多模态学习

已录制 年份 名字 简介 引用
2021 CLIP 图片和文本之间的对比学习 citation
2021 ViLT 第一个摆脱了目标检测的视觉文本模型 citation
2021 ViLD CLIP蒸馏帮助开集目标检测 citation
2021 GLIP 联合目标检测和文本定位 citation
2021 CLIP4Clip 拿CLIP直接做视频文本retrieval citation
2021 ActionCLIP 用多模态对比学习有监督的做视频动作分类 citation
2021 PointCLIP 3D变2D,巧妙利用CLIP做点云 citation
2022 LSeg 有监督的开集分割 citation
2022 GroupViT 只用图像文本对也能无监督做分割 citation
2022 CLIPasso CLIP跨界生成简笔画 citation
2022 DepthCLIP 用文本跨界估计深度 citation

自然语言处理 - Transformer

已录制 年份 名字 简介 引用
2017 Transformer 继MLP、CNN、RNN后的第四大类架构 citation
2018 GPT 使用 Transformer 解码器来做预训练 citation
2018 BERT Transformer一统NLP的开始 citation
2019 GPT-2 更大的 GPT 模型,朝着zero-shot learning迈了一大步 citation
2020 GPT-3 100倍更大的 GPT-2,few-shot learning效果显著 citation

系统

已录制 年份 名字 简介 引用
2014 参数服务器 支持千亿参数的传统机器学习模型 citation
2018 GPipe 流水线(Pipeline)并行 citation
2019 Megatron-LM 张量(Tensor)并行 citation
2019 Zero 参数分片 citation
2022 Pathways 将Jax拓展到上千TPU核上 citation

图神经网络

已录制 年份 名字 简介 引用
2021 图神经网络介绍 GNN的可视化介绍 citation

优化算法

已录制 年份 名字 简介 引用
  2014 Adam 深度学习里最常用的优化算法之一 citation
  2016 为什么超大的模型泛化性不错   citation
  2017 为什么Momentum有效 Distill的可视化介绍 citation

新领域应用

已录制 年份 名字 简介 引用
  2016 AlphaGo 强化学习出圈 citation
  2020 AlphaFold 赢得比赛的的蛋白质3D结构预测 citation
2021 AlphaFold 2 原子级别精度的蛋白质3D结构预测 citation
2021 Codex 使用注释生成代码 citation
2021 指导数学直觉 分析不同数学物体之前的联系来帮助发现新定理 citation
2022 AlphaCode 媲美一般程序员的编程解题水平 citation

多谢支持~

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,多谢支持~

打开微信扫一扫,即可进行扫码打赏哦