您现在的位置:首页 >> 装修问答

【科普】自研SoC行不行?Google Tensor试验与分析

发布时间:2025/08/03 12:17    来源:涡阳家居装修网

理论模型上有两颗 X1 超大氢,其 CPU 多氢机动性则会比单颗 X1 的电机子产品不够强。而高频率上,Google Tensor 的 X1 都是 2.8GHz,略很略高于骁龙 888 的 2.84GHz 和 Exynos 2100 的 2.91Hhz。此均,Google 还和骁龙888 一样给了 1MB L2 线程,比 Exynos 2100 的 512KB 残血 X1 不够壮。

大氢(出书:你迷恋叫之中氢也唯)这边,Google 为了让了从前的 A76 核心,这是件很有前瞻性的公事(2.25GHz,256KB 的 L2 线程)。显然这未必合理,因为 A77 和 A78 的机动性和能效比都不够很低。连 Anandtech 都从未人从 Google 那从前得到明确的说明。

他们猜测意味著是几年之前的设计CPU的时候,惠普手上也从未人有不够新 IP 供 Google 为了让。也意味著是在超大氢扯成X1 的时候,从未人有时间连大氢也三人扯了。但 Google 必要不是特地选用 A76 的,因为从前面的次测试可以发现,A76 就让是跟不上以之前了。

小氢这边,4 个 1.8GHz 的 A55。Google 为了让了 128KB 的 L2 线程,而不是惠普 Exynos 自己用的 64KB,这让这个 CPU 不够像骁龙888 了。但来得好奇的是,Google 把协同的 L3 线程高频率和 A55 绑定,这则会造成了延时和浮点运算解决办法。另均,这也和 Exynos 2100 的 L3 高频率是完全完全相同的。

Google Tensor 的 GPU 是 Mali- G78 MP20,需求量仅次于麒麟 9000 的 G78 MP24(出书:G78 的超强)。大家最开始以为 Google 则会用高位的高频率来大大提高能效比。但结果 Google 竟然把OpenGL高频率举到 845MHz,把 tiler 和 L2 高频率举到 996MHz,居然癫狂。另均,它也是第一个用上 G78 转化高频率特性的电机子产品。

作为参考,Exynos 2100 的 G78 MP14 也“只是” 854MHz,后者的瞬时浮点运算并未很很低了。结果 Google 减少 42% 的一个中心,却依然保持稳定很低频。因此它的瞬时机动性很让人欣慰,但瞬时浮点运算也则会很壮。而磁盘支配器似乎和 Exynos 2100 完全相同,支持 4x16bit 的 LPDDR5,理论模型增益 51.2 GB/s。

它也用了 8MB 的系统的设计线程,但还不清楚有否用了和惠普 Exynos 2100 一样的 IP,因为它们的核心和唯为方式将都不实在一样。Google 大量运用于 SLC 来大大提高 SoC 机动性(有数他们自己的自概念基本功能)。这个 SLC 强制自的区,将 SRAM 专门从公事分给 SoC 上特定的 IP 块,使它们在完全完全相同用例下,能对全部或均线程展开独占会见。

ISP 与 TPU:谷歌的耀眼

大家却说 SoC 集成的 ISP 时,经常把它们描述为单个 IP。但无论如何,ISP 是完全完全相同的各个领域 IP 块的组合,每个 IP 块管控显像竖井之中的完全完全相同使命。而 Google Tensor 并不古怪,因为它将惠普用在 Exynos CPU上的一些片段统合到了三人,同时还将自己开发的自概念基本功能统合到了提高效率之中 —— 正如 Google 在展示 SoC 时所却说的那样。

显像系统的设计均和 Exynos 是一样的,如相位探测管控单元、反差对焦管控单元、图象缩放器、散光校正管控块和纹理背向函数管控块等。比 Exynos 少的均,意味著是惠普的一些图象后管控基本功能。

谷歌在 ISP 之中加入自己的 3AA 基本功能(基本功能曝光,基本功能白平衡,基本功能对焦) ,以及一对自己的时域降噪 IP 基本功能(用做对齐和分拆图象)。这些很意味著就是谷歌所却说的那些有助于减太快管控机的基本功能,这些是 Pixel 复刻版计算摄影家的一均,毋容合理性地地代表了管控机提高效率之中并不重要的均。

TPU 是让 Google Tensor 被被称作 Tensor 的大多。Google 并未用自研 TPU 好几年了,在驱动侧重,Google 把 Tensor 的 TPU 称作 Edge TPU( 端侧边缘 TPU)。这是不够为古怪的接收器,因为它必要和 Google 2018年发唯的 Edge TPU 有关,后者是 Google 为边缘举理而的设计的 ASIC CPU(官网 cloud.google.com/edge-tpu)。

年初的 Edge TPU 宣称在 2W 浮点运算下可以给予 4TOPS 的算力,但 Google 并未发布 Tensor 的 TPU 机动性指标,但是在一些次测试之中可以想到它的第二大牵引力是 5W 近。因此如果它们毕竟是有相关联的,直接影响这几年的DRAM和 IP 上的进步, Google Tensor 的 TPU 机动性必要有明显大大提高了。

这个 TPU 是谷歌CPU一个团队的勇敢,它刚刚运用于月所数据深入研究管控核心,这个核心针对 Google 内均运营数据深入研究的方式将展开过简化,并且坚称它可以强制开发新、独特的用例,这是 Google 做自概念 SoC 的主要能够和出发点之一。在右边的次测试之中,这个 TPU 的机动性指标毕竟也是令人评语深刻的。因为 TPU 的个人信息不多,我们勉强基于它的BIOS做简单猜测,它意味著包含四一个中心的 Cortex-A32 CPU。

其他基本功能:微支配器与音视频编码器器

在舆论编码器全面性,Google Tensor 运用于了惠普的多功能播放器(与 Exynos 复刻版同款),还有一个看上去有如用做 AV1 编码器的自研 IP 块。这有点好奇,因为惠普的宣传品之中, Exynos 2100 是有 AV1 编码器功能的,而且这个功能说是也在内氢BIOS进去。但在 Galaxy S21 复刻版之中,这个 AV1 编码器功能从未在 Android 的侧重充分为了让过。

谷歌加入的这个专用的 AV1 编码器器被他们称做 “ BigOcean”,它能让 Android 系统的设计具备 AV1 硬解能力。但并不好奇的是,它就让就只主要职责 AV1, 其他格式编码标准还是由惠普的 MFC 主要职责。

Google Tensor 的磁带子系统的设计也完全完全相同,Google 用自己的设计的 IP 块只用了惠普的很低浮点运算磁带编码器子系统的设计,它们可以在无需全部苏醒 SoC 的之前提展开很低浮点运算的磁带播放。我们显然这均也是当协管控器用的,这也是 Google Tensor 和 Exynos 完全完全相同的大多。

Google 还用了一种被称作 Emerald Hill 的应用程序磁盘缓冲器,对磁盘网址展开 LZ77 压缩减太快,反过来也可以用来减太快交扯之中的 ZRAM 的卸载步骤。现在还不确定 Pixel 复刻版有否并未启用这个基本功能,但能证实在“ /sys/block/zram0/comp_algorithm”目录之中有“lz77eh”。作为课均数据,惠普早在 5 年之前,就在 SoC 从前集成了类似的应用程序压缩 IP 基本功能。但出于某些或许,这些基本功能从未被启用过,也许是能效比并从未人有他们仅仅之中的很低。

图源PBKreviews

另均,Google 还用惠普的 Exynos 微支配器,得出结论了第一台非很低通的毫米波iPad。Pixel 6 复刻版用的是惠普的 Exynos 5123 微支配器(译者:为遵循国均的习惯,这从前把调制解调器被称作微支配器)。惠普在 2019 年就所述自己的毫米波电机子元件和天线基本功能,却说 2020 年则会浮现在量产机组人员(不究竟此之前有否计划让 Pixel 6 在 2020 年香港交易所)。Pixel 6 复刻版的瞬时速度可以翻倍 3200Mbps,但很多次测试之中,它的网速只有很低通电机子产品的一半近。

虽然是同一个微支配器,但它不是像 Exynos 2100 那样集成在 SoC 从前,而是用者的。意味著是因为 Google Tensor 的 GPU 和 CPU 需求量实在大了,而且 TPU 的需求量也是未知数。显然就算得把微支配器用者回去,Google Tensor 的需求量也是不够为大了,即便是和对比 Exynos 2100 的之前提。

总的来看,Google 毕竟的设计和概念了 Tensor ,同时有很多 Google 特有的的设计,是总体的CPU上的互补。但从不够中下层的相来得,Tensor 和 Exynos 有很多共通之处,用了很多惠普特有的系统化基本功能,因此叫它“半自概念”或许则会不够合适。

也就是说机动性展示出:不尽如人意

次测试之中,Google Tensor 的 DRAM 延时较很低,还不如 Exynos 2100,和骁龙888 比就不够差了。Google 晓得了磁盘支配器,它则会根据增益和内氢的磁盘襟翼百分比来支配 MC 和 DRAM 速度,这均是和惠普完全完全相同的,其也就是说为了让率也不如惠普的磁盘支配器很低。现在不究竟是 CPU 的解决办法,还是整个 SoC 内均的解决办法,但这清楚地影响了前面的次测试。

它的 L3 延时也不够为很低,比 Exynos 2100 和骁龙 888 很低得多。Google 从未人有给 DSU 和 CPU L3 线程的游戏特定的高频率,而是把它和 A55 小氢的高频率相关联。好奇的是,即便 X1 或 A76 满载,A55 和 L3 却在很低频 “摸鱼”。除此以均之前提 Exynos 2100 和骁龙 888 都是则会提很低 L3 高频率的。

在系统的设计线程次测试之中,能想到 11-13MB 的延时情况 (1 MB L2 + 4 MB L3 + 8 MB SLC) ,在但会的磁盘会见之中,Tensor 也是比 Exynos 要太快的,意味著和被晓得的个别线程竖井有关。

因为 L3 和 A55 的高频率捆绑,且高频率很低,所以 Google Tensor 的 A55 小氢是几个 SoC 从前 L3 延时最很低的,彷如从未人有异步偏移桥一般。

CPU 均,Google Tensor 不够有如骁龙 888,而不是 Exynos 2100。虽然 Google Tensor 的 L2 线程是 Exynos 2100 的 2 倍,但高频率很低了 3.7%(110MhHz)。

Tensor 的要强点是磁盘延时,造成了 SPEC 次测试之中很多难事都比 骁龙888 和 Exynos 2100 太快,但耗电机却不够很低(CPU 在天和等磁盘)。SPEC 总分上,Tensor 的展示出比 Exynos 2100 略差,对比骁龙888 的落伍幅度翻倍 12.2% ,由于冲刺次测试的时间不够长,终究耗电机还多了 13.8% 。折算跟着,相较骁龙888 的落差必要是 1.4% 近。

它也有和 Exynos 2100 一样的降频解决办法,只是相较从未人有那么轻微。如果加热得当,机动性则会很低 5%-9% 近(所示的次测试结果是在 11 度的自然环境下得到的)。

可怜的 A76 大氢,骁龙 888 的 A78 比它强 46%,还不够自治区电机,也就是说 IPC 落差在 34%,这倒合乎两个套入错综复杂的落差。如果居然为了自治区电机,完全可以做个很低频的 A78,但结果 Google 放了两颗高频率又很低、又耗电机、机动性还不唯的 A76,勉强举断 Google 是从未人得选,而不是有意而为之。

越少相近右下角,能效比越少很低;越少相近左上角,能效比越少很低 ↑

A55 小氢这边也不唯,机动性只是比同频的骁龙 888 的 A55 很低 11%(感谢 L3 和 SLC),但却几乎是 2 倍的浮点运算,俨然就是继承者了 Exynos 很低浮点运算 A55 的后裔,能效比甚至比自己的 A76 大氢还诺束发。进去SoC天玑 1200 的 A55,再次进去 A14 的能效一个中心,这居然个严酷的世界。

Google Tensor 因为诺束发的 A76 机动性展示出,就算有 2 颗 X2 都无法尽失,拖很低了总体最高分。X1 本身也比对手稍太快一些,大均时间的能效比都和 Exynos 2100 的 X1 明确。但 A76 实在落伍以之前实在多了(无论是机动性还是能效比),而 A55 又继承者惠普很低能效的传统观念,一言难尽就是了。

GPU 这边需求量大,高频率很低,但 3DMark Wild Life 次测试的瞬时机动性只比 Exynos 2100 很低 21%。在 GFX Bench 的 Aztec 片中次测试之中,连赢 Exynos 2100 14%,小幅连赢骁龙888。虽然运用于了分频的设计,但说是瓶颈在 GPU 的其他大多。

Tensor 的 GPU 瞬时牵引力很低达 9-10W,iPad一赛跑就降频(一轮次测试都从未人冲刺啊……),拖很低了总体浮点运算,所以才则会有 7.28 W 的平均浮点运算。Pixel 6 复刻版从未人有热管,通风固定式和机身骨架不够有如 iPhone,而不是壮堆通风的Miranda母舰。它赛跑起来时,左方的 SoC 45 度,但右侧只有 30-33 度,通风毕竟是要强。

让人庆幸的是,月内这批 SoC 都的游戏了很低得不切也就是说的 GPU 高频率,一赛跑就降频。意味著是为了促使突发的 GPU 增益?或者是其他什么或许?但无论怎么样,也就是说能效比是受累了。

而 Tensor 的浮点运算解决办法,给与 Pixel 6 Pro 虽然也是LTPO显示屏,但展示出和惠普母舰明显完全完全相同,全屏随之而来亮度750nit,数倍很略高于 S21U 的 942 nit,也就是说但会系统化浮点运算意味著则会不够很低。多种主因,终究让 Pixel 6 Pro 的续航未必吓人,反倒是 90Hz 的 Pixel 6 续航展示出还亮眼:

TPU:极强的举理机动性

这是 Google Tensor 尽失面子的大多。MLPerf 次测试之中,Pixel 是在 NNAPI 赛跑的,其他制造商是各自的特,很低通是 SNPE(早先简化了 MLPerf 1.1,大大提高了总分)、惠普是 EDEN,SoC是 Neuron,而的产品从未人有 coreML 减太快,所以吃亏。

在图象分类、能够探测和图象重叠指导工作增益之中, Tensor 总分很略高于很低通,但强于惠普。而在自然语言管控(MobileBERT 开放性),Google Tensor 给予了骁龙 888 3 倍的机动性,举理均强得很。Google 在宣传品从前,毕竟也所述过高分辨率核苷酸、翻译者等运用于片中是其互补所在。

还从未人发唯的 GeekBench ML 次测试,用是 TensorFlow 开放性,代表的是 GPU 的数据深入研究机动性。这时候 Google Tensor 就要强于 Exynos 2100。如果用 NNAPI 开放性,此时是 CPU+GPU+NPU 的混合指导工作,Google Tensor 就可以大幅连赢骁龙 888。

除了并不一定机动性,赛跑 AI 次测试时,Pixel 6 Pro 的平板电机脑浮点运算和 Exynos 2100 的 Galaxy S21 Ultra 相近。单独展开举理使命时, Exynos 2100 的一触即发牵引力翻倍 14W,骁龙 888 也有 12W。但因为 Google Tensor 的 AI 机动性不够很低,所以终究能效比要不够很低一些。

不过 Google 还从未人有计划举出相关的 SDK 让开发者去不够好地为了让这颗强盛的 TPU 。但再次进去惠普,它的 NPU 发唯都 2 年了,现在都从未人有 SDK…… 现在 TPU 的强盛机动性,主要集之中体现在在此之前 app 从前,有如给摄像头加入不够多的数据深入研究功能,以及各种翻译者功能。

总结

Google 坚称,他们花钱自研 SoC 的主要或许是总体的 SoC 在数据深入研究上的机动性和能效比实在很低。而 Tensor 的数据深入研究机动性和能效,被用来支撑新用例和体验,例如我们在 Pixel 6 复刻版上想到的很多数据深入研究特性。有如高分辨率核苷酸、高分辨率翻译者和管控机等算法,所有这些都是运营在 Tensor 的 TPU 上的。

虽然 Google 意味著就让默许或者谈论,但 Google Tensor 毕竟就是和惠普协作的副产物,大均都源自 Exynos,并继承者了惠普在能效比全面性的要强点。CPU 被古老的 A76 拖后腿,需求量庞大的 GPU 被通风拖后腿,但 TPU 毕竟展示出很好,特别是形式自然语言管控全面性,数倍数倍压过所有竞品。

但总的来却说,我们显然 Google 并未通过 Tensor 充分为了让了最初的能够。我们不究竟 Google 新一代的 SoC 则会走什么样的巴士线,但我们很有兴趣等等看。

株洲看妇科哪个医院比较好
昆明治疗甲状腺医院哪家好
济南男科医院怎么样
我成功啦
医药健康
心脑血管肿瘤
腹胀便秘
感冒咳嗽有痰喝什么能快速止咳化痰

上一篇: 误配置文件后数据如何恢复?

下一篇: 游戏日报研究院:游戏市场实际销售收入或超2900亿,有鉴于此入局看好未来

友情链接