英特尔超线程技术是什么

小白QA2020-06-15 22:18:17阅读(...)

英特尔超线程技术是全新英特尔酷睿 i7 , 酷睿 i5 处理器和英特尔至强5500 系列处理器所具有的一种性能特点。简单来说它可使处理器中的1 颗内核如2 颗内核那样在操作系统中发挥作用。

英特尔超线程技术是全新英特尔酷睿 i7 , 酷睿 i5 处理器和英特尔至强 5500 系列处理器所具有的一种性能特点。简单来说,它可使处理器中的 1 颗内核如 2 颗内核那样在操作系统中发挥作用。这样一来,操作系统可使用的执行资源扩大了一倍,大幅提高了系统的整体性能。

英特尔超线程技术是什么

在谈论内核、线程、超线程这些术语时容易让人产生混淆。为简化概念,1 个内核就是 1 个 CPU。每个英特尔酷睿 i7 或英特尔至强 5500 处理器在出厂时均有 4 个内核(未来可能会提供其他版本)。

工作原理

超线程技术的原理很简单,以前的单核心处理器,在同一时间内只可以处理一项工作 (线程,Thread),如果要处理一项以上的工作时,以前的单核心处理器是不可行的,所以英特尔就开发了超线程技术,以一个单核心的处理器,去模拟出双核心的环境,但这并非能够把处理器的效能提升双倍,原因在于实体的核心始终只有一个,而效能有约百分之二十至三十增长。

在奔腾四时代 INTEL 就已经引入了超线程技术,而特意的加长的流水线反而成了 HT 技术的累赘。

所以推出奔腾 D 及后来的酷睿 2 系列时,英特尔并没有加进超线程技术,因为奔腾 D 及酷睿 2 处理器已支援双核心处理器的运作,而且 INTEL 也在默默的钻研指令预测技术减少流水线。在酷睿 2 后期英特尔推出了酷睿 2 四核心处理器,因为有用户反映双核不足以应付手头的工作,再到后来, 英特尔酷睿 i7 出现了,他带着 Intel 全新的超线程技术,很短的流水线这得益于他的指令分支预测技术,拥有着奔腾四无法企及的效率,它是四核心处理器加进了超线程技术,处理器同时支持处理八个线程的工作,在这种环境下电脑可挂很多应用程序,支持多线程的应用,因此即使 N 多程序同时运行,电脑也没有运行减慢的感觉,操作起来依然是流畅如行云流水。

其实超线程技术拥有最高的功耗效能比,加入超线程技术所增加的晶体管数目及功耗并不多,但却相比增加一颗完整的核心更具性价比,加上酷睿 i7 微架构拥有高带宽及高容量三级高速缓存的优势,更能将超线程技术的功效发挥到极致。

要打开超线程技术,很简单,一般而言,在 BIOS 内就可以设定超线程技术的启动与否。当设定完成后,进入 Windows 的“我的电脑”,查看处理器,就能看出八个线程的工作情况。

加入超线程技术的英特尔酷睿 i7 处理器在多任务应用时最能发挥它的潜能,它可以同时处理 N 个的游戏及多媒体软件,而不会出现慢式死机。有人做了一些评测,是用 Cinebench 10,跑 Far Cry 2 及 Company of Heroes 来测试有打开超线程技术与没有开启的性能的区别。

以下是测试结果:

超线程技术 打开 关闭

Cinebench 10 1m06s 1m19s

Far Cry 2 (FPS) 43.5 FPS 40.5 FPS

Company of Heroes (FPS) 175.2 FPS 168 FPS.

从以上结果不难看出, 加入超线程技术的英特尔酷睿 i7 处理器,打开超线程技术后明显性能提升明显。这无疑为追求高性能运算的用户提供了更多保障,可以说英特尔酷睿 i7 是定位高端的用户的最佳选择。

技术性能

英特尔超线程技术可以有多种方式帮助提升运算性能。对于台式机系统来说,英特尔超线程技术可以帮助台式机同时进行多项应用。针对软件编程者来说,通过英特尔超线程技术,你可以采用更多的软件线程以获得更多的运算核心。对于运算负荷更大的服务器来说,英特尔超线程技术可以激发出每个核心的运算潜能,将从而提升系统的资源利用率。总而言之,由于英特尔超线程技术将通过提供更多的软件线程,从而在运算时可以享受到更大内存等的应用体验。

技术种类

MultiThreading 多线程就是在一个单个的处理核心内同时运行多个工作线程的技术,和 CMP(Chip MultiProcessing,芯片多处理)不同,后者是通过集成多个处理内核的方式来让系统的处理能力提升——也就是常见的多核技术。主流的 处理器都使用了 CMP 技术。

然而 CMP 技术大规模增加了相应的电路,从而增加了成本,MT(MultiThreading)技术却不是这样,它只需要增加规模很少的部分线路(通常,约 2%)就可以提升处理器的总体处理器能力,从而可以很简单地提升相关应用的性能。

MultiThreading(或作 Multi-Threading)来源于可以追溯到上个世纪 90 年代开始的 一个叫做 ILP(Instruction Level Parallelism,指令级并行化)的思想,这个思想产生了一个叫做 Throughput Computing(吞吐量计算)的名词,用来提升如在线交易这样的并行计算的性能。Throughput Computing 的两种主要方式就是 MultiProcessing 和 MultiThreading。

一开始,为了开发 ILP,在截至到 2009 年的几十年中利用了超标量(Superscalar,同时具备多个执行器)、乱序 执行(Out-Of-Order Execute,允许无数据关联性的指令同时运行)、动态分支预测、VLIW(Very Long Instruction Word,超长指令集 ) 等技术(前三种可在经典的 Pentium Pro 架构上看到,最后一个就是 Itanium 的

特色技术)。然而,超标量使设计的复杂性急剧增加,同时,指令之间的数据和控制相关,可以开发的 ILP 也有限,以及一些其它因素,使得经典的超标量结构处理器难以进一步提高处理器性能。

而且从应用的角度看,如在线事务处理 OLTP、决策支持系统 DSS、Web 服务等这样的应用的特点是具有丰富的 线程级并行性(Thread Level Parallelism)而缺乏 ILP,因此也就促使了 MultiProcessing 和 MultiThreading 的出现。

MultiThreading 多线程技术的思想有些类似于早期的分时共享计算系统,执行多个线程的处理器在遇到 某个线程由于 Cache Miss 或者分支预测失败而停顿的时候,可以切换到另一个线程来执行。主流的 MultiThreading 具有着三种形式,差别在于线程间共享的资源 以及线程切换的机制:

多线程架构异同

多线程技术

线程间共享资源

线程切换机制

资源利用率

粗粒度多线程

Coarse-Grained MultiThreading

除取指令缓冲、寄存器、控制逻辑外

流水线停顿时

提升单个执行单元利用率

细粒度多线程

Fine-Grained MultiThreading

除寄存器、控制逻辑外

每时钟周期

提升单个执行单元利用率

同步多线程

Simultaneous MultiThreading

除取指令缓冲、返回地址堆栈、寄存器、控制逻辑、重排序缓冲、Store 队列外

所有线程同时活动,无切换

提升多个执行单元利用率

CMT——Coarse-Grained MultiThreading

它是最简单的多线程技术,当单一执行线程遇到长时间的延迟,如 Cache Missed 时,就进行线程切换,直到原线程等待的操作完成,才切换回去。Coarse-Grained MultiThreading 有时也叫 Block MultiThreading 堵塞多线程或者 Cooperative MultiThreading 协作多线程。

由于 CMT 很简单,因此很多处理器都有实现,除了下面列出之外,很多嵌入式微控制器都有实现:

1999 年的 IBM RS64 III「Pulsar」(单核心/双线程)

2005 年 Fujitsu SPARC64 VI「Olympus-C」(双核心/4 线程)

2006 年 Intel Itanium 2「Montecito」(双核心/4 线程)

2007 年 Intel Itanium 2「Montvale」(双核心/4 线程)

FMT——Fine-Grained MultiThreading

随时可以在每个时钟周期内切换多个线程,以追求最大的输出能力——当然,随时可以切换也是有代价的,它拉长了每个执行线程的 平均执行时间。Fine-Grained MultiThreading 有时也叫 Interleaved MultiThreading 交错多线程或者 Pre-emptive MultiThreading 抢先多线程。

和 CMT 比起来,FMT 要复杂一些,因此相应的处理器就没有那么多,例:

2005 年 Sun UltraSPARC T1「Niagara」(8 核心/32 线程)

2007 年 Sun UltraSPARC T2「Niagara 2」(8 核心/64 线程)

虽然 CPU 上使用 FMT 技术的并不多,不过我们可以看看另一个领域:GPU,NVIDIA 和 ATI 的 GPU,都使用了 FMT 技术。

SMT——Simultaneous MultiThreading

SMT 具有多个执行单元,可以同时运行多条指令,因此才叫做“同步多线程”!CMT 和 FMT 都是在单个执行单元下的技术,不同的线程在指令级别上并不是真正的“并行”,而 SMT 则具有多个执行单元,同一时间内可以同时执行多个指令,因此前两者有时先归类为 TMT(Temporal MultiThreading,时间多线程),以和 SMT 相区分。SMT 起先源自充分挖掘超标量架构处理器的潜力——超标量的意思就是可以同时执行多个不同的指令。因此 SMT 具有最大的灵活性和资源利用率,然而实现也最复杂。例:

2002 年 Intel Pentium 4 Xeon「Prestonia」(单核心/双线程)

2007 年 Sun UltraSPARC T2「Niagara 2」(8 核心/64 线程)

2008 年 Intel Core i7「Nehalem」(4 核心/8 线程)

系统技术

首先,可以先确认下,是否使用的处理器、芯片组、操作系统及 BIOS 支持这项技术。当然,采用基于英特尔架构,即英特尔全新酷睿微体系架构(Nehalem)的处理器的台式机和服务器平台一般都支持该技术。其中大多数系统都允许把超线程技术作为一种 BIOS 选择来启用或禁用(一般预设为启用状态)。用户可以通过 Windows 中的任务管理器或 Linux 的 /proc/cpuinfo 命令查看处理器信息。

如果系统支持超线程(HT)技术且启用了超线程,则可看到的处理器数将是平台实际拥有的物理内核数的一倍。例如,如使用的是双路的英特尔至强 5500 系列服务器,则会看到这套系统拥有 16 个处理器。(8 个物理内核上运行 16 个软件线程,每个内核运行 2 个线程。)

两种技术

可以简单地把双核心技术理解为两个“物理”处理器,是一种“硬”的方式;而超线程技术只是两个“逻辑”处理器,是一种“软”的方式。从原理上来说,超线程技术属于 Intel 版本的多线程技术。这种技术可以让单 CPU 拥有处理多线程的能力,而物理上只使用一个处理器。超线程技术为每个物理处理器设置了两个入口─AS(Architecture State,架构状态)接口,从而使操作系统等软件将其识别为两个逻辑处理器。这两个逻辑处理器像传统处理器一样,都有独立的 IA-32 架构,它们可以分别进入暂停、中断状态,或直接执行非凡线程,并且每个逻辑处理器都拥有 APIC(Advanced Programmable Interrupt Controller,高级可编程中断控制器)。虽然支持超线程的 Pentium 4 能同时执行两个线程,但不同于传统的双处理器平台或双内核处理器,超线程中的两个逻辑处理器并没有独立的执行单元、整数单元、寄存器甚至缓存等等资源。它们在运行过程中仍需要共用执行单元、缓存和系统总线接口。在执行多线程时两个逻辑处理器均是交替工作,假如两个线程都同时需要某一个资源时,其中一个要暂停并要让出资源,要待那些资源闲置时才能继续。因此,超线程技术所带来的性能提升远不能等同于两个相同时钟频率处理器带来的性能提升。可以说 Intel 的超线程技术仅可以看做是对单个处理器运算资源的优化利用。而双核心技术则是通过“硬”的物理核心实现多线程工作:每个核心拥有独立的指令集、执行单元,与超线程中所采用的模拟共享机制完全不一样。在操作系统看来,它是实实在在的双处理器,可以同时执行多项任务,能让处理器资源真正实现并行处理模式,其效率和性能提升要比超线程技术要高得多,不可同日而语。

i7 发布

2009 年 9 月 8 日,英特尔正式发布了全新的 Core i7/i5(酷睿 i7/i5)处理器与 P55 主板芯片组。可以说全新的酷睿 i7/i5 处理器是非常重要的产品,它们的发布意味着先进的 Nehalem 微体系架构 CPU 开始进入主流市场,同时将电脑的集成性和智能化提升到新的高度。

Core i7/i5 处理器拥有卓越的性能,支持独特的英特尔睿频加速技术(英特尔清晰视频技术),是期待顶级数字媒体、办公应用、游戏等应用体验的用户的理想之选。其中,性能卓越的酷睿 i7 处理器还支持英特尔超线程技术,给用户带来更强的多任务性能。而酷睿 i5 虽然没有超线程技术,但是和新发布的 i7 处理器一样,带有英特尔新推出的睿频加速技术。据英特尔方面介绍,该技术可根据程序的需求自动加速处理器,以保证程序流畅运行,同时还能根据系统情况智能化地切换到节电状态。

众多的产业合作伙伴包括来自戴尔、方正科技、海尔电脑、华硕电脑、技嘉科技、金山软件、联想、微软、微星科技的嘉宾,以及媒体、技术发烧友和游戏玩家等出席了发布会。

英特尔公司中国区总裁杨叙先生发表开幕致词,英特尔始终致力于推动芯片制程与架构创新的进步,不断推出性能更加强大、能效更加优化的产品。全新的酷睿 i7/i5 处理器,凭借各种先进技术包括英特尔睿频加速技术,进一步将智能化的性能和突破性的计算体验推向主流市场。

英特尔睿频加速技术是英特尔酷睿 i7/i5 处理器的独有特性通过智能化地加快处理器速度,从而根据应用需求最大限度地提升性能。

现场演示了酷睿 i5 的游戏性能与办公性能,游戏采用的是金山公司开发的《剑侠情缘 3 Online》,这款网络游戏为多核心处理优化,拥有逼真效果,酷睿 i5 处理器拥有非凡表现。酷睿 i5 的 PhotoShop 的渲染速度是 Core 2 Q8300 四核的 2-3 倍,是 Pentium 4 630 的 N 倍。

全新的酷睿 i7/i5 处理器,凭借各种先进技术包括英特尔睿频加速技术,进一步将智能化的性能和突破性的计算体验推向主流市场。

截至 2009 年 9 月 18 日, Intel 酷睿 i7 860 处理器,在国内已经销售。

收藏0个人收藏
走进科技生活方式

评论交流

泪雪默认头像请「登录」后参与评论
  1. 加载中..