论文研究13:AN EMPIRICAL STUDY OF CONV-TASNET
abstract
Conv-TasNet是最近提出的基于波形的深度神经网络,可在语音源分离中实现最先进的性能。它的体系结构由可学习的编码器/解码器组成和一个在此学习空间之上运行的分离块。已建议对Conv-TasNet进行…
Benchmarking Chinese Text Recognition: Datasets, Baselines, andan Empirical Study
论文链接:
Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study
项目链接:
GitHub - FudanVI/benchmarking-chinese-text-re…
论文:CLIP-KD: An Empirical Study of CLIP Model Distillation 链接:https://arxiv.org/pdf/2307.12732 CVPR 2024
Introduction
Motivation:使用大的Teacher CLIP模型有监督蒸馏小CLIP模型,出发点基于在资源受限的应用中&…
An Empirical Study of Scaling Law for OCR
Abstract
在自然语言处理 (NLP) 领域,模型大小、数据量、计算和模型性能的规律已经得到广泛研究。然而,光学字符识别 (OCR) 中的缩放规律尚未得到研究。为了解决这个问题,我们进行了全面的研究&…