GPU概述

任务 在对CPU进行了解后,不妨下一步对与它相似的GPU进行系统认识。初次注意到它是对于深度学习设备的联系,感觉它具有卓越的运算性能。GPU对图像显示的功能主要体现在游戏画面,整个发展过程不妨随游戏的变化直观感受。 定义 图形处理器(英语:Graphics Processing Unit,缩写:GPU;又称显示核心、显卡、视觉处理器、显示芯片或绘图芯片)是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上运行绘图运算工作的微处理器。 意义 图形处理器使显卡减少对中央处理器(CPU)的依赖,并分担部分原本是由中央处理器所担当的工作,尤其是在进行三维绘图运算时,功效更加明显。图形处理器所采用的核心技术有硬件坐标转换与光源、立体环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等。 技术背景与发展 黑白 最初,电脑中处理影像输出的显示芯片,通常很少被视为是一个独立的运算单元。虽然英伟达公司(NVIDIA)在1999年8月发表GeForce 256绘图处理芯片时首先提出GPU的概念,但从上世纪70年代起,已经可以在游戏机上显示图像,但方式是直接用CPU桶式移位器把图像数据输出到显示器上。 彩色 到80年代时,第一块使用大规模集成电路技术的GPU诞生,是美国的一家图像芯片公司制造的NEC µPD7220,它也带动了一次GPU革命浪潮,推动intel公司第一款图像处理芯片82720的出现,能够处理16位的彩色图像。 3D 随着图像显示技术的发展,越来越多种颜色可以显示在屏幕上,也应运而生了2D和3D的专用芯片,日本的游戏公司Namco在1988年发布的Namco System 21是第一款针对3D图像显示设计的游戏主板。 VGA与SVGA 这两个词语是在C课设期间耳熟能详的两种显示方案,其实它们的含义分别是: VGA是IBM于1987年提出的一个使用模拟信号的电脑显示标准。这个标准已对于现今的个人电脑市场已经十分过时。 原本SVGA是IBM用来扩展旧VGA标准而提出的新标准,之后SVGA是由开放组织VESA所制定,并且工业界放弃了为每个更高标准给定独特命名的企图。几乎在1990年后期至2000年前后,显卡能表现出的各种显示规格都被归类在SVGA中。 个人电脑 1990年代初期,Microsoft Windows的崛起引发人们对高性能、高清晰度二维位图运算的兴趣。在个人电脑市场上,Windows的优势地位意味着台式机图形厂商可以集中精力发展单一的编程接口,图形设备接口。这个时期出现的Win G图形接口成为包括PS在内的大批3D软件的支持API,此外有大量游戏,其中之一是风靡美国的首款第一人称视角射击类游戏:Doom。我也在一个提供游戏模拟器的网站体验了这个小游戏,选择难度为中档(hurt me plenty),居然在第二关就被怪物的大火球烧死,得出结论:菜鸟在任何时期都是菜鸟。 OpenGL OpenGL是出现于90年代初的专业图像API,并成为在个人电脑领域上图像发展的主导力量,和硬件发展的动力。虽然在OpenGL的影响下,带起广泛的硬件支持,但在当时用软件实现的OpenGL仍然普遍。 此前我很容易把OpenGL与OpenCV混淆,一个区分方法是,前者将图像显示在计算机上,后者用计算机处理图像。 运用它进行渲染的游戏不计其数,一个著名的例子是B站Up主老番茄的成名之作杀手(HitMan)的首部。 科学计算 到2002年10月,随着ATI Radeon 9700(也称为R300)的推出,世界上第一个Direct3D 9.0加速器,像素和顶点着色器可以实现循环和冗长的浮点数学运算,并且很快变得像CPU一样灵活,但是对于图像阵列操作,速度更快。像素阴影通常用于凹凸贴图,从而增加纹理,使对象看起来发亮,暗淡,粗糙,甚至圆形或挤压。 随着Nvidia GeForce 8系列的推出,GPU成为了更加通用的计算设备。被称为GPU计算或用于GPU上的通用计算的GPGPU的研究子领域已进入机器学习,石油勘探,科学等领域图像处理,线性代数,统计, 3D重建,甚至股票期权定价确定。当时的GPGPU是现在称为计算着色器(例如CUDA,OpenCL,DirectCompute)的先驱,实际上通过将传递给算法的数据视为纹理贴图并通过绘制三角形或四边形来执行算法,从而在一定程度上滥用了硬件使用适当的像素着色器。显然,这会带来一些开销,因为实际上不需要的部件包括扫描转换器之类的部件(三角形操作也不是一件值得关注的事情,除了调用像素着色器外)。 总结上面的概念,是利用GPU卓越的并行计算性能来进行实际上与图像处理无关的数学运算。举个实例,比特币早期通过CPU来获取,而随着GPU通用计算的优势不断显现以及GPU速度的不断发展,矿工们逐渐开始使用GPU取代CPU进行挖矿。 自动驾驶 2019年NVIDIA发布全球最大自动驾驶处理器DRIVE AGX Orin,它的构成正是集成了NVIDIA的下一代GPU架构和Arm Hercules CPU内核,以及新的深度学习和计算机视觉加速器,这些加速器合计每秒可提供200万亿次操作。 参考资料 Graphics processing unit-wiki https://en.wikipedia.org/wiki/Graphics_processing_unit 图形处理器-维基百科… Continue reading GPU概述

CPU概论

任务 综述在计算机发展中两个例子,详细描述当时的技术背景,所描述的对象,总结其特点、进步点、推动计算机技术发展的价值和意义、缺陷及后续技术改进等,鼓励图文并茂。 意义 热点新闻是厂商发布高性能的CPU,内行人士可以感受到不同代际间的发展变化,但外行看到各种参数只是不明觉厉,不知晓其中的突破点与先进性。但正如绪论中让人印象深刻的一个观点:硬件工程师需要理解软件需求以得到研发方向,而软件工程师在理解硬件的基础上能使软件的性能得到最大程度的提升。因此,对CPU进行了解是有必要的,这是本次综述选题的出发点。 技术背景 最初计算机的目的正是为了计算,大多数采用的数制是10进制,即每一位由10个真空管表示。在1949年,轻量化BINAC(Binary Automatic Computer)的诞生使工业界向二进制的方案趋近,不过二进制的具体表示在原码、反码和补码的摇摆中才过度到现代的补码表示。 在计算机发明之初,它的软硬件设计是独特的,即使同一公司生产的不同产品也无法共享程序。因此公司的用户粘性很低,更新换代的优先考虑是价格与性能,而非无法沿用数据的旧产品的下一代。IBM公司注意到这一痛点,新的研发方案致力于打造可以使软件通用的不同性能的产品线,这样可以使用户根据需求变化沿用系列产品,这是IBM 360的诞生契机,也是第一个里程碑式指令集的架构的出现,在后面对CPU特点的论述中,可以看到指令集正是CPU的核心所在。 当然,此时的CPU由于生产工艺与电子器件限制,仍然是巨型的机器,对于IBM 360系列部分产品的相关参数如下表所示: Model Announced[14] Memory size (in (binary) KB) Weight (lbs) Notes 30 Apr 1964 8-64[16] 1700 (770 kg)[17]:2030.1   40 Apr 1964 16-256[18] 1700-2310 (770-1050 kg) depends on memory.[17]:2040.1   50 Apr 1964 64-512[19] 4,700-7,135 (2,100-3,236 kg) depends on memory.[17]:2050.2,2050.4 Supported IBM 2361 Large Capacity Storage (LCS). 20 Nov… Continue reading CPU概论

Matlab计算传感器静态特征参数

任务 对于《传感器检测与技术》中第二章的数据计算题目,需要对系列数据进行处理,可以利用Matlab中的矩阵运算和相关函数快速实现。下面以一道例题进行分析,并最后附上最小二乘法求取拟合直线的相关代码。 题目 设有压力传感器的校准数据列于下表,试求 (1)端基拟合直线; (2)端基线性度; (3)滞环误差; (4)重复性误差(λ=3); (5)准确度。 解答 端基拟合直线 端基拟合是求取传感器线性度的拟合直线中一种,顾名思义,是直接连接输入/输出曲线两端点以得到拟合直线。 但由于题目中提供测量的多组数据,故需要取平均值: 输出: 则两端点分别为(0.0,0.0031)与(5.0,0.9995),相应得出拟合直线Y=A0+KX中的参数值: A0=0.0031 K=(0.9995-0.0031)/(5.0-0.0) 端基线性度 线性度则是通过定义公式进行求取,即实际输入/输出曲线与拟合直线的最大偏差ΔYm与满刻度输出值Yfs的比值,由于题目仅提供散点,则只需选取散点的最大偏差进行计算。 滞环误差 计算正、反行程差距最大偏差与最大输出与满刻度输出值之比 重复性误差 通过贝塞尔公式求取标准差,可以通过matlab中的std()函数实现。 准确度 将上述得到的线性度σL、滞环误差σH与重复性误差σR代入公式即可。 最小二乘法 参考资料 MATLAB中矩阵各列求和,各行求和,所有元素求和 概率统计:MATLAB计算标准差和方差 std 贝塞尔公式与标准偏差

信号处理与信号产生电路

考点分析 大题 多个类型电路组合,进行分析 最常见:RC串并联(文氏电桥)正弦振荡发生器+电压比较器(产生矩形脉冲)+积分电路(产生三角波) 电路频率 满足起振的电阻阻值 电压比较器定量画出电压传输特性 画出各输出端波形 正弦波振荡电路 振荡条件 振幅平衡:|AF|=1 相位平衡:φa+φf=±2nΠ 在RC串并联电路中满足上述条件,由选频网络中,Fmax=1/3,φf=0.负反馈回路中需要调节阻值,使A=3,在电压串联负反馈中有:1+Rf/R>3时,可以振荡,通过稳幅措施使电路达到振幅平衡条件。 典例 正弦波振荡电路 10.6.6设运放 A是理想的,试分析图题10.6.6所示正弦波振荡电路: (1)为满足振荡条件,试在图中用+、-标出运放A的同相端和反相端; (2)为能起振,Rp和R2两个电阻之和应大于何值? (3)此电路的振荡频率f。等于多少?(4)试证明稳定振荡时输出电压的峰值为 解:

Published
Categorized as 模电 Tagged

反馈放大电路

考点分析 大题 提供电路图,进行分析: 标注极性 反馈类型(电流/压、串/并联、正/负反馈) 表达式:反馈系数F、闭环增益Af 交叉考题 提供反馈电阻Rf,动手连线完成题目要求,进一步完成上面的部分分析 分类 极性分析正/负反馈 原理 输入信号的增加,引起反馈信号对输入信号的作用。 方法 假设输入信号在某瞬时极性为+,逐级标注输出信号与输入信号的相位关系——点电位的瞬时极性/支路电流的瞬时流向,最后观察反馈信号,削弱输入信号是负反馈,增强输入信号是正反馈。 例 FET的源级偏置电路,当g为+时,s为+,此时Rs两端电压上升,Vgs=Vi-Vs下降,即输入信号被削弱,为负反馈。 重点 对FET、BJT的相位关系清楚,遵循规律标注即可。 输出短路法判断电流/压反馈 原理 电压反馈,则反馈信号与输出电压Vo存在比例等关系。若将输出电压Vo短路后,反馈信号仍可存在,则反推为电流反馈。 方法 将负载短路,Vo端接地,判断此时反馈信号是否存在。 反馈信号Xf是完全由输出信号Xo决定的,因此需要将Xi置零后判定Xf。 此外,可以先归纳出反馈信号的表达式,则可直观看出是电流反馈还是电压反馈。 例 最常见也最易主观将方式归类于电压反馈,细心判断下面的两个电路分别属于哪种反馈类型? 由于将负载短接后,放大电路仍然有输出电流,反馈信号也存在,即二者皆为电流反馈。 知识点:输出电流一般指放大器的输出电流 串/并联 最简单,直接观察电路中:反馈信号与输入信号采取何种方式连接?串接串联,并接并联。 综合演练 相对于分析类型的考题,自己设计的难度更大,下面是一道例题: 8.1.6由集成运放A及BJTT、T2组成的放大电路如图题8.1.6所示,试分别按下列要求将信号源vo、电阻R,正确接入该电路。 (1)引入电压串联负反馈;(2)引人电压并联负反馈;(3)引入电流串联负反馈;(4)引入电流并联负反馈。 思路:首先确定电压与电流反馈方式,电压反馈需要与输出端h相连,电流则连接g。其次确定输入端与反馈端接法,由负反馈与串/并联方式决定,容易的办法是先假设一种接法,转换成分析题,判断是否符合题意。 解: (1)a-c、b-d、h -i、j-f(2)a -d、b-c、h- i、j- f(3)a -d、b -c、g-i、j – e(4)a-c、b-d、g-i、j-e 性能影响 引入负反馈,降低了放大电路的闭环增益,但是放大电路的许多性能指标得到了改善,如: 提高了放大电路增益的稳定性 减小了反馈环内的非线性失真 抑制了反馈环内的干扰和噪声 负反馈使放大电路的通频带得到了扩展 输入/输出电阻 串联负反馈使输入电阻提高;并联负反馈使输入电阻下降 电压负反馈降低了输出电阻,电流负反馈使输出电阻增加… Continue reading 反馈放大电路

Published
Categorized as 模电 Tagged

模拟集成电路

考点分析 大题:一种差分放大电路的参数分析 双端输出差模增益Avd 差模输入电阻Rid 输出电阻Ro 单端输出差模增益Avd1 共模增益Avc1 共模抑制比 掌握:镜像电流源计算 概念:模拟放大电路的一些参数(如何调整阻值以消除偏置电流) 差分放大电路 这里利用电路的对称性,设计出的差分放大电路能够有效抑制零点漂移。 关键思路为(以bjt为例): 理想恒流源的动态电阻ro趋于无穷,差模输入时由于电路对称性,源极所接动态电阻ro相当于短接,此时双入双出的增益为-βRL’/rbe;而共模输入中动态电阻ro存在,利用源极偏置电路的增益公式,可知此时增益极小。则共模抑制比在理想情况下趋于∞。 补充:关于共模增益的计算 将对称电路分解为单边,动态电阻ro视为两个2ro电阻并联公式为: -βRL’/(rbe+(β+1)2ro 疑问:为什么输出电阻为2*Rd 直流偏置技术 回忆FET与BJT放大器件在饱和/放大区的特征图像,电流是近似水平线的。因此可以利用这一特性,改进获得稳定的直流电源。 典例 当差分式放大电路两输入端电压为vi1=250mV,vi2= 150mV,则vid=        mV,vic=        mV。 关键点:考察vid(difference)差模输入电压与vic(common)共模输入电压的概念 解析:  差模输入电压为两个输入信号的差值,共模输入电压为两个输入电压的算术平均值,因此差模输入vid = vi1 – vi2=250-150=100mV;共模输入vic=(vi1+ vi2)/2=(250+150)/2=200mV. 在电路图示的源极耦合差分式放大电路中,VDD = VSS =5V,IO = 0.2mA,电流源输出电阻ro=100kW,Rd1 =Rd2 =Rd = 10kW,FET的Kn=1.5m,且ro >>rds >>Rd,那么T2漏极单端输出时的差模电压增益Avd2 =________,共模抑制比KCMR =________。 关键点:取出单端输出为T2漏极,则增益应为–得+值 思路:通过直流源Io得到静态工作点参数,算出gm值;代入增益计算公式分别得出差模与共模增益 解析:  T2漏极单端输出时的差模电压增益Avd2 为共源极电路增益的一半,而共源极电路的增益为-gm*Rd,恒流源电流为0.2mA,因此MOSFET漏极电流为这个电流的一半,从而ID1=ID2=0.1mA,从而可以计算出管子的gm =2* (Kn*ID1)^(1/2)=0.77mS,因此共源极电路增益为:-0.77*10=-7.7,而差分电路从T2管单端输出增益为正,且增益为这个共源极电路增益的一半,也就是3.85电路的共模增益为:-gmRd/(1+gm*2ro),这里的ro表示恒流源的内阻,ro=100kΩ,可以得到共模增益为Avc=-0.0497,因此共模抑制比为:3.85/0.0497=77。 图示电路中,已知运放741的IIO=20nA,IIB=100nA,VIO=5mV,且R2=R1//Rf ,那么电路的输出直流误差电压VO =________。 关键点:Iio输入失调电流; Iib输入偏置电流;Vio输入失调电压;当它们较大且电路参数设计不合理时,可能导致输出进入饱和区而使电路无法正常工作。 思路:这里通过调整 R2= R1//Rf ,消除偏置电流IIB引起的误差,则只需计算Iib输入偏置电流与Vio输入失调电压的影响结果。 解析:  VO=(1+Rf/R1)VIO+Rf*IIO=507mV 全功率带宽BWP… Continue reading 模拟集成电路

Published
Categorized as 模电 Tagged

放大电路的频率响应

前言 期末考试周前的复习已经持续近一周,再次感受到知识浓度的暴涨。不忘初衷,在对知识有更高角度的领悟后,进行总结。 重点:突出重点,答疑难点 考点分析 非每年重点考察,多集中于概念,未出现计算实际电路的高频/低频响应 根据传递函数绘制波特图 写出简化模型的传递函数 计算上/下限截止频率 说明高低频主要影响因素 计算特定放大电路的带宽 工程简化分析法 此前分析放大电路时,忽略电容的影响。但实际信号中含有多种频率成分,由于某类电容的影响只在特定频段显著,在工程中我们可以将其分为低频、中频与高频独立分析。 小知识 上图英文缩写代表不同种类的频段,如: 种类 频段(frequency bands) 应用举例 Very Low Frequency (VLF) 3KHz to 30KHz 潜水 Low Frequency (LF) 30KHz to 300KHz RFID,高速的ETC是其中的分支应用(但应用频段在5.8GHz) Medium Frequency (MF) 300 KHz to 3 MHz AM调频 High Frequency (HF) 3 MHz and 30 MHz NFC Very High Frequency (VHF)… Continue reading 放大电路的频率响应

Published
Categorized as 模电 Tagged

wordpress应对广告评论

任务 解决垃圾评论问题 过程 做为中文写作、但wordpress配置为英文的选手,某日收到一封长篇英文评论,感到惊奇。读时发现原来是广告……没有开启屏蔽垃圾评论的插件,但这种评论只增不减,必须要处理 加入黑名单 设置中有选项,可以屏蔽某关键词的评论,但某些垃圾评论采用平淡的方式,只是留下的网站链接是广告(假的劳力士?) 所以效果不是很好,再寻找其他方式,通过修改主题的functions.php 实现 修改主题 参考文章 在functions.php中添加如下代码:

大时延系统PID的整定

任务 初赛的练习工程二需要控制产物的温度,但由于系统的滞后性,最初搭建的单回路系统只能使温度上下跃动。 今天通过资料查阅,形成了一套整定PID参数的方案,并得到实验证实。 过程 得到系统参数 根据知乎提问:网上许多资料都是直接给出被控对象的模型的,而我需要自己去确定一阶纯滞后对象的滞后时间和系统时间常数。请问怎么做? 解答者提供思路如下: 用阶跃响应测出飞升曲线,用飞升曲线找出惯性时间常数和纯滞后时间常数,建模 标准poor 于是搜索飞升曲线法,找到资料:相关分析法和参数估计。该PPT中具有详细步骤,属于实验建模中的时域法建模。 向控制系统施加阶跃信号,观察阶跃响应曲线 判定是否有纯滞后 根据相应计算方法得出K、τ与T 应用计算公式 同样是资料大延迟过程的PID参数整定中提供的计算公式,可以快速算出适宜的PID参数

比值控制系统

任务 进行第三种控制系统的学习,主要是对二者关系进行限定 要点 有之前的基础后,这个比值系统没有独特的地方,只是一个被控对象的设定值按照另外一个变量的相应比例进行变化。 在实际工程中,多见的情况是控制两种物质的流量。 实例 两条回路都是闭环控制,对FI102的控制可视为通过控制FV102的单回路控制,而FI102的当前数据通过乘法器提供相应比例,传送做为FI103的给定值。 Process Value:当前值 Output Value::输出值 Set Point:给定值 运行到合适的时机,将控制器FIC103投串级,便意味着工作的设定值由外部输入。 此外,本工程要求得出一定物质的量浓度的甲醇,因此需要根据公式求出水与甲醇的比例。