好的数据集质量,决定后续模型的上限 (Better data leads to better models),那么怎么快速评估数据集的质量了?本文分享的Facets,是一款由Google开源、快速评估数据集质量的神器;Facets包含2个组件: facets overview&am…
0. 前导内容
ASCII,GBK和UTF-8各种编码区别 (htmonster.xyz)
1. 官网定义区别
Strings, bytes, runes and characters in Go - The Go Programming Language
1.1 byte 字节
字节大家肯定都熟悉。
字节是计算机的存储单位,1byte8bits, 1…