首页
建站知识
建站知识
/
2024/11/14 18:24:15
http://www.tqpw.cn/7Ui0N3mE.shtml
相关文章
PSCAD学习笔记(1)Project Settings(重点snapshot设置)
引言 该学习笔记结合官方文件和个人学习见解撰写,主要分享一些常见实用功能,欢迎讨论、补充、指正。 项目设置Project Settings 打开方式:仿真界面空白处右键——Project Settings 时间设置(Time Settings) Duration of Run (sec) 这是模拟…
阅读更多...
MLA Review之四:logistic回归
终于来到logistic回归,logistic回归其实很简单,之前的说到的神经网络就用到了这个方法,其中最重要的就是使用了sigmoid损失函数。当然使用的方法也就最简单的梯度下降法,这里并没有使用之前神经网络的随机梯度下降法,也…
阅读更多...
大模型KV Cache节省神器MLA学习笔记(包含推理时的矩阵吸收分析)
首先,本文回顾了MHA的计算方式以及KV Cache的原理,然后深入到了DeepSeek V2的MLA的原理介绍,同时对MLA节省的KV Cache比例做了详细的计算解读。接着,带着对原理的理解理清了HuggingFace MLA的全部实现,每行代码都去对应…
阅读更多...
ChatGLM2-6B模型的win10测试笔记
ChatGLM2-6B介绍: 介绍 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性: 更强大的性能:基于 ChatGLM 初…
阅读更多...
word论文中引用参考文献的简单方法(网页链接)
一、参考资料 中文论文或者申请书中网页新闻引用格式 自制网页:在论文中快速引用网页链接 二、相关介绍 1. 常用文献类型用单字母标识 学术论文参考文献中文献类型字母标识 常用文献类型用单字母标识,具体如下: (1…
阅读更多...
MLA Review之三:朴素贝叶斯分类
朴素贝叶斯(Naive Bayes),贝叶斯概率论在整个统计学习上都是泰山北斗一样的存在,《Pattern Recognization and Machine Learning》这一扛鼎之作全书的思想其实就是贝叶斯概率论,简单的说就是先验代替后验。 我们先来给朴素贝叶斯找…
阅读更多...
非功能关键知识总结(一)
文章目录 一、稳定性(一)、服务级别协议1、SLA2、OLA3、UC (二)、可用性指标(三)、突发事件等级 三、质量(一)、千行代码缺陷数量(二)、软件质量模型的发展(三)、产品质量模型 四、安全(一)、网络安全 五、灾备(一)、灾备指标(二)、灾难恢复等级(三)、容灾技术分类 一、稳定性 …
阅读更多...
长序列(Long Context)大模型笔记
知乎:Rooters链接:https://zhuanlan.zhihu.com/p/926602895 过去一年中,长序列大模型(LLM)的训练和推理方法在业界取得了显著进展,本文将从模型建模和机器学习系统两个方面进行总结,并讨论一些值…
阅读更多...
MLA Review之二:决策树
分类决策树是一种描述对实例进行分类的属性结构,决策树由内部节点和叶节点,内部节点表示一个特征或者属性,叶节点表示一个类。 Part 1 :决策树生成 用决策树分类其实是一个if-then的过程,根据一个特征值的取值将原始的…
阅读更多...
MLA Review之五:回归
回到回归的正题,回归问题是机器学习领域中应用的比较广的一种方法,不过我觉得大部分的回归模型都是广义线性模型,在Andrew NG的课程中,对广义线性模型做了比较详细的推导,这篇文章的内容是,线性回归、局部加…
阅读更多...
MLA Review之一: KNN算法
在看完Machine Learning in Action一书之后,觉得还是需要进行一些回顾,而且由于第一次看的时候Python基础并不牢固,所以这次也当做是Python一些知识回顾和运用的过程。 在回到主题之前插几句话,MLA 一书并不是一本理论著作&#x…
阅读更多...
【ARM】乘法指令
00. 目录 文章目录 00. 目录01. 乘法指令概述02. MUL 指令03. MLA 指令04. UMULL 指令05. UMLAL 指令06. SMULL 指令07. SMLAL 指令08. 附录 01. 乘法指令概述 ARM 乘法指令完成两个数据的乘法。两个 32 位二进制数相乘的结果是 64 位的积。在有些 ARM 的处理器版本中…
阅读更多...
【LLM】(KV cache优化)MHA、MQA、GQA、MLA、YOCO机制的区别
note MQA、GQA、MLA本质都是在围绕“如何减少kv cache同时尽可能保证效果”进行优化的产物。从Layer的视角来看,MQA/GQA可以认为是Intra-Layer KV Cache Shared(层内KV Cache共享),而YOCO提出的想法,则可以认为是Inte…
阅读更多...
大模型推理--MLA
本来想写一篇KV Cache压缩的综述性博客,结果写到MLA部分的时候发现越写越多,完全值得单独拿出来写篇博客,遂从KV Cache压缩博客中单独揪出MLA进行介绍。 MLA(Multi-query Latent Attention)是国内创业公司deepseek在24年5月份发布的DeepSeek…
阅读更多...
redis(3):安装
安装Redis是开始Redis学习之旅的第一步;Redis约定次版本号(即第一个小数点后的数字)为偶数的版本是稳定版(如2.8版、3.0版),奇数版本是非稳定版(如2.7版、2.9版),生产环境…
阅读更多...
量化交易---期权的数据源
期权数据的数据源,目前其实挺难搞的。要不就是收费的,免费的资源其实挺难的。 但我发现一个网站,其实有这样的,但是需要你自己去分析 https://stock.finance.sina.com.cn/option/quotes.html 打开开发者模式,你想要都…
阅读更多...
star ccm+ 用户指南_star-ccm边界层处理方法
1. 问题 边界层处理是所有CFD工程师都面临的一个难题, 第一层取多厚? y+值是多少? 做多少层? 层与层间的增长比例? 边界层总厚度多少? 与试验值不符合,要不要再加密一下……种种问题不一而足。 边界层理论在所有流体力学著作里都有涉及,最专业的著作当属德国航空专家H.…
阅读更多...
爬虫prc技术----小红书爬取解决xs
知识星球:知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具知识星球是创作者连接铁杆粉丝,实现知识变现的工具。任何从事创作或艺术的人,例如艺术家、工匠、教师、学术研究、科普等,只要能获得一…
阅读更多...
INOBITEC DICOM VIEWER PRO 2.9.1 Crack
INOBITEC DICOM VIEWER 比 Radiant dicom viewer 更好的医学影像图查看器 About the release of the Inobitec DICOM Viewer 2.9.1 Lite and Pro editions. Released on Match 17, 2023. History of changes: Legend: [] Addition, [*] Enhancement, [-] Elimination of a d…
阅读更多...
fo-dicom开源库是如何满足 DICOM标准的基本要求
前言 前一篇文章,我们介绍了fo-dicom是一个怎样的开源库:fo-dicom,第一个基于.NET Standard 2.0 开发的DICOM开源库,在学会使用fo-dicom进行DICOM数据处理之前,需要先了解几个非常重要的概念: DICOM基本概…
阅读更多...
推荐文章
scrt如何切换成英文版_SecureCRT 简介,中英文对照
fiddler 抓包 mumu 模拟器详细配置步骤
【seeed Wio Terminal】实现在 arduino 中使用 LvGL GUI
单片机编程技巧—状态机编程
MQTT--快速入门
快速排序
MySQL大表优化方案
大型Web网站优化总结一
武汉知名 IT 公司大盘点
做网站的怎么敢忽视客户?
云手机哪个好用最流畅?红手指、双子星、雷电云手机性价比推荐排行
淦!看了 B 站上的这些 Python 视频,我站起来了!
CNBLOG开篇
今天开通了cnblog
回归cnblog
尝试cnblog
cnblog博客停用
open live writer cnblog