当前位置:论文写作 > 毕业论文范文 > 文章内容

NewSweetyisComingNVIDIAGeForceGTX1060详解

主题:高性能服务器架构 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2024-01-25

简介:大学硕士与本科性能架构毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写性能架构方面论文范文。

性能架构论文范文

高性能服务器架构论文

目录

  1. 1. 硬件多重投影引擎S I M U L T A N E O U S M U L T I -PROJECTION
  2. 2.动态负载平衡(DYNAMIC LOADBALANCING)
  3. 3.GPU Boost 3.0
  4. 4.Ansel
  5. 5.VRworks Audio+Touch
  6. 高性能服务器架构:高性能架构试听-集群实验课任务分配

在旗舰级基于GP104核心的GTX 1080和1070发布的一个月后,Pascal架构的甜点级产品GP106才姗姗来迟.也许是受了AMD RX 480的市场火爆的刺激,GTX 1060从公布之日起,其论文范文与规格无不让人联想到它直接指向的目标就是RX480.NVIDIA更是在宣传资料中声称GTX 1060的性能将超越GTX 980,这又为GTX 1060戴上了耀眼的光环.不到2000元的公版起售价,比很多非公版GTX 970还要低,却拥有比GTX 980还强的性能?NVIDIA是开了一个玩笑,还是真的为消费者带来了一道非常可口的甜点大餐?

文/图 夏松

外观解析,还是泰坦皮

在外观上,GTX 1060仍然采用了与公版GTX 1080、GTX 1070一样的“泰坦皮”设计,银白色的金属质感冲击力非常强.不过和GTX 1080、1070等不一样的是,GT X 10 60将正面均热板前的透明亚克力板去掉了,直接将均热板裸露在外,少了几分塑料感,却多出了一分刚毅,我认为这种设计相比GTX 1080/1070无论是在外观还是散热性上都要优秀不少.由于在外观上它几乎是一脉继承了GTX1080的所有特质,在之前GTX 1080的深度测试文章中我们已经有过针对GP106显卡外观及散热设计的详细讲解,在这里就不赘述了.不过有一点需要特别指出的是,GTX 1060取消了SLI多卡互联的桥接金手指接口.虽然NVIDIA的解释是GTX 1060这种档次的显卡基本不需要SLI多卡互联,但怎么看都有些掩耳盗铃的味道,毕竟GTX 1060的SLI模式极有可能逼近甚至达到GTX 1080的水准,而论文范文却低不少.小小猜测一下,NVIDIA会不会是因为阻止玩家组双卡实现更实惠的GTX 1080的性能而故意为之的呢?

核心解析,中庸强劲

GP106核心初窥

Pascal架构GP106芯片主要有以下几个明显的特质.

★超过10组全新设计的,包含了几何引擎、光栅化引擎等的论文范文s单元.每个论文范文s单元包含一组负责处理几何任务需求的PE.同时还管控5组基本的论文范文渲染单元,每个论文范文单元包含8个负责处理材质以及特种运算任务的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系.

★制程采用了来自台积电的16 nmFINFET工艺.

★拥有3个64bit组(两个32bit为一组)的显存控制器,总计192bit位宽.每个32bit的显存控制器包含了8个ROPs单元和256KB二级缓存.所以,我们在最终的规格表中可以看到GTX 1060拥有共计48个ROPs单元和1.5M二级缓存.

★针对PolyMorph Engine,PE引擎进行了改良.现在PE包含了为VR设计的The Simultaneous Multi- ProjectionEngine.在高负荷情况下,论文范文P引擎可以大量减少VR所需的渲染工作量.

可以看出,G T X 1 0 6 0 所采用的GP10 6核心仍然基于全新的Pascal架构,采用全新的16nm工艺制程.在16nm工艺的强大优势之下,GP106核心内部集成了44亿晶体管.虽然逊色于同为16nm工艺的GP104的72亿,却远远超过了相同定位的上一代产品GTX 960的29亿,超越幅度达到了50%,而核心面积却只有Maxwell架构的GTX 960的88%左右.

从规格表上可以看到,GTX 10 60核心的流处理器数量为1280个,正好是GTX 1080的一半.纹理单元为106个,ROPs数量为48个,并且由三个64bit的显存控制单元组建了192bit/192GBps的显存通道,容量大小为6GB.而且单从频率上来看的话,其基础频率1506MHz,最论文范文oost频率1703MHz的范围更是来势汹汹,遥遥领先上一代产品GTX 960.单从GP 106的规格来看的话,无疑它已经绝对领先于GTX 960,各项指标均有大幅度的提高.如果仅仅从规格上来看,GTX1060相比GTX 980在CUDA数量上要逊色不少,接近800的CUDA流处理器数量缺口,能否凭借更高的频率、更高效率的核心架构以及更先进的制程工艺来弥补呢?NVIDIA宣称的超越GTX 980的性能是否能实现?我们将在稍后的测试中一一验证.

Pascal架构的核心技术

关于Pascal架构核心的主要特征技术解析,我们在此前的报道中已经有过详细的讲解.在这里,我们只简单总结一下GP10 6所具备的几项特征技术,更详细的技术解析,请参考本刊2016年6月下刊《NVIDIA GTX 1080显卡深度品评》一文.

1. 硬件多重投影引擎S I M U L T A N E O U S M U L T I -PROJECTION

VRWorks无疑是伴随这带Pascal架构而来的重点软件技术创新,其中有关图形渲染的重点则是SIMULTANEOU论文范文ULTI- PROJECTION(简称论文范文P,硬件多重投影).论文范文P可以让基于Pascal架构的GPU渲染基于16个不同角度的画面,并根据需求分别呈现.为了高效率的实现多角度画面同步投射,NVIDIA不仅更新了算法,还在Pascal架构GPU中集成了论文范文P硬件引擎模块,每组论文范文s一个.在VR兴起之后,我们的图形渲染势必要从单一显示器画面像双眼画面过度.这其中涉及到画面切割、画面畸变、画面多角度渲染的问题.NVIDIA优化了有关镜头畸变的算法,能够减少40%左右的无用(不会显示在头盔视野里)的图形渲染.更重要的是,NVIDIA借助论文范文P,实现了SinglePass Stereo这一重要功能.SPS能够让原本需要分别渲染的左右眼画面,简化到只需要渲染一个眼睛所见的画面,另一画面由论文范文P硬件单元通过特定的算法合成.此时,论文范文P具有硬件、软件协作的高效率开始发挥作用,多角度引擎,让另一角度画面的合成几乎不再额外消耗显卡计算资源.如此一来,在VR头显上输出同样的画面,GP106的工作量能瞬间减半,理论上帧率自然可以大幅度提升,最高近2倍.当然,论文范文P的优势不仅如此,在对畸变的处理上也有裨益,能够降低多连屏或曲面屏用户面临的画面拉伸问题,可以根据需要,更真实地模拟人眼环视效果.

2.动态负载平衡(DYNAMIC LOADBALANCING)

在Pasc al架构上,NVIDIA宣称弥补了异步运算能力不足的问题,并强调Pascal架构原生支持异步运算,包括基于GPU的物理加速、音频处理、渲染帧的后期处理以及VR中的异步时间扭曲算法中都可以用到异步运算.但NVIDIA并没有给出什么实际的测试数据来支撑,反倒是在动态负载平衡(DYNAMIC LOADBALANCING)的原理上废了一番口舌.不得不说,新的动态平衡机制赋予了Pascal架构更灵活的处理能力,无论是图形渲染的,还是计算相关的任务都能够互不影响.任务拆分并行计算本就是异步运算的精髓,从这一点来看新的Pascal架构无疑比Maxwell强了不少.

3.GPU Boost 3.0

在以往的Boost 2.0上,NVIDIA提出了根据功率动态调整频率的设计,在当时看来这是已经是非常先进的方式,能尽可能的维持GPU的高频率.但由于这个机制太过线性,导致GPU在各个电压点上,没有办法最大程度挖掘潜力.而Boost3.0就是针对此项进行了改进,它可以设置各个电压点的频率偏移,使频率偏移与单个电压点一一对应.这样就可以使得GPU的频率达在每个设定电压点下获得最大限度的挖掘,压榨出GPU的所有剩余性能.

高性能服务器架构:高性能架构试听-集群实验课任务分配

4.Ansel

你要问我Ansel的意义的话,我倒真心觉得这是NVIDIA为艺术类玩家开发的新玩具,甚至是新的创作工具.实际上在很久以前,就有不少本职专业摄影师的游戏玩家提出这种需求,他们需要更好的工具来实现游戏中的艺术创作,而不是简单的截图工具.很显然,NVIDIA的Ansel给了他们这个机会.而且其灵活性甚至比现实世界更高,现实中去不了的取景点它也能完美驾驭.实际上,Ansel的名字就来自伟大的摄影师Ansel Adams,照顾艺术家们的意图显露无疑等目前,如《全境封锁》、《见证者》、《巫师3》等已经有不少游戏宣布提供对ansel的支持,能够满足玩家们自由创作的需求.更重要的是NVIDIA宣称支持Ansel基本没有难度,NVIDIA已经完成了功能开发,游戏开发商只需加入简单的少量代码就能支持.

5.VRworks Audio+Touch

VR是NVIDI A、AMD争夺的未来新焦点,从上代Maxwell开始,NVIDIA就已经在图形计算上针对V R的需求优化,比如畸变图形的渲染显示等等.这一次P a s c a l发布,更是一口气推出了VRWorks开发包.前面我们已经说过它有关图形渲染的功能,实际上它还包含了音频拟真技术—VRWorks Audio.VRWorks Audio音频还原借鉴了光线追踪渲染的思路,实现虚拟场景中的声音追踪,可以模拟声音在场景内的互动映射、反射等等,仿真出现实中声音碰到障碍物的效果,让你听到的声音更准确的契合VR场景,让沉侵体验更加逼真.

当然,要营造身临其境的VR体验,光有视觉和听觉还不够,还要有触觉才能实现三位一体.所以我们看到VRWorks 开发包中,还基于成熟的PhysX物理加速引擎,提供了对VR场景内的触觉交互,比如通过手柄传达给用户的震动、偏移、阻尼等等(如HTC Vive的手柄).譬如在VR切气球,轻轻的触碰气球会有真实的气球回弹的感觉.

性能测试,小胜GTX 980

枯燥的数据总是让人觉得无趣,而玩家们最关心的莫过于在1999元公版指导价的基础之下,GTX 1060到底能带给我们多少的惊喜,或者失望?为此,我们特别找来了公版GTX 1070、公版GTX 980以及非公版GTX 970,让它们在同一平台下竞技,是骡子,还是马?很快就能见分晓.需要说明的是,由于GTX 970没有公版产品,各厂商的产品基本都在NVIDIA的指导规格之上有所超越,我们特地找了一张相对接近NVIDIA GTX 970参考标准的非公版显卡,但其性能仍然高于公版规格,因此在性能上相比GTX 980相差并不算大.而对于GTX 960,虽然理论上它是GTX1060上一代的对位显卡,但考虑到GTX10 6 0 的实际性能,我们认为加入GT X960的性能比较其实没有太大意义.

理论性能测试

从3 D M a r k F i r e S t r i k eExtreme(2.5K)、FireStrike Ultra(4K)以及3DMark-Time Spy(DirectX 12)的测试成绩来看,GTX 1060的表现的确可圈可点.其整体性能相比GTX 970领先幅度约15%~20%,但相比GTX 980而言,则在FireStrike Ultra和Extreme模式下都略处于下风.GTX 1060在Time Spy的DX12测试中与GTX 980基本打个平手,成绩相差不超过1%.不过在基于DX11的FireStrike测试中,GTX 1060相比GTX 980却有着大约3%~5%的差距,略略逊色于后者.

游戏测试

不同于3DMark FireStrike中的胶着状态,整体来看GTX 1060在DirectX 11游戏中表现出了领先GTX 970 10%以上的性能,相比GTX 1070,它又落后大约30%左右.不过在与GTX 980的对比上,有趣的是二者的差距在两个游戏的测试中各有论文范文.在《古墓丽影9》的测试中,GTX 1060领先GTX 980约5%,而在《神偷4》的游戏测试中,反而是GTX 980略略占优,4K模式下领先GTX 1060约4%,而1080p模式下二者基本打个平手.

在两个DirectX 12游戏的测试中,GTX 1060再次表现出了强劲的势头,不但成绩远超GTX 970 30%以上,而且对GTX 980来说,它也展现出了不小的优势,领先幅度将近5%~20%不等.不过相比GTX 1070而言,GTX 1060仍然只能达到约70%~75%的性能,与理论测试基本相符.

GTX 1060,值得购买

坦白讲,在NVIDI A最初宣称GT X1060性能超过GTX 980,且公布的论文范文甚至不会比GTX 970高时,我们对此还是持有一定的怀疑态度的.毕竟对GTX 980来说,作为NVIDIA上一代的桌面显卡次旗舰产品,应该不会被下一代的甜点产品轻易击败吧?不过事实胜于雄辩,GTX 980除了在3DMark理论性能测试中领先于GTX 1060之外,在游戏的测试中都没有表现出明显强于GTX 1060的性能,二者各有论文范文.从这一点而言,NVIDIA并未在GTX 1060的宣传上夸大其词.尤其是在DirectX 12模式下,GTX 1060在测试中几乎都领先于GTX 980.这一方面说明了Pascal架构相比Maxwell的确在DirectX12的优化上下了狠功夫,之前NVIDIA被一直诟病的“DirectX 11是英雄,DirectX12变成虫”的现象已经不复存在,更没有出现Ma x well显卡上常见的Direct X12“负优化”的情况.另一方面,也证明了全新的16nm工艺为GPU性能与执行效率的提升做出了巨大贡献,架构与工艺的革新双管齐下,GTX 1060表现出如此抢眼的性能也就在情理之中了.如果GT X1060在实际售价上不比NVIDIA 1999元的论文范文起步指导价高很多,而且货源充足的话,无疑它有潜力成为甜点级显卡市场上的一名巨星.GTX 970、GTX 980,真的可以彻底退休了.需要提醒的是,别忘了,GTX 1060可是定位于GTX 960的替代者,而现在它的性能已经足足超越了GTX 980,NVIDIA这次推出的甜点产品的确可以用“良心”二字来形容.或许也是因为GTX 960被玩家吐槽太多次“规格过低”而迫使NVIDIA做出的改变吧!

当然,肯定有玩家会想到,这次GTX10 6 0的推出,毫无疑问是剑指AMD的RX 480,二者无论是规格还是论文范文上,都是“针锋相对”.RX 480先于GTX 1060推出,尽管曾被吐槽“偷电”,但在推出之后叫好声还是远远多于谩骂声,市场反响非常优秀.或许正是迫于RX 480带来的压力,NVIDIA才决定将GTX 1060定位在RX 480竞争者的角色上,并保持着与后者几乎完全一样的市场论文范文区间.从本期的测试中,我们在性能上看出了GT X1060相比GTX 970、GTX 980等上一代显卡在论文范文与性能上的优势,那么GT X1060相比RX 480来说,在同级的竞争上是否有足够的优势呢?而且AMD在看到GTX 1060推出市场之后,是否会再次对RX 480的论文范文进行调整呢?也许在近期,就能见分晓!而《微型计算机》评测室也将在下一期的文章中,为您带来甜点对甜点的大碰撞,GTX 1060 Vs. RX 480,到底谁能够领先一步,不仅仅是性能,而是全方位的对碰!敬请期待.

总结:此文是一篇性能架构论文范文,为你的毕业论文写作提供有价值的参考。

高性能服务器架构引用文献:

[1] 论文写作基本架构 论文写作结构方面问题
[2] 广播电视和架构本科论文开题报告范文 广播电视和架构毕业论文怎么写3000字
[3] 智慧校园平台和架构硕士毕业论文范文 关于智慧校园平台和架构方面自考开题报告范文2000字
《NewSweetyisComingNVIDIAGeForceGTX1060详解》word下载【免费】
高性能服务器架构相关论文范文资料