神经网络编码是什么

小嘿 2020-04-14 10:28:09
QA

人工神经网络技术具有良好的容错性、自组织性和自适应性,因此在图像压缩过程中,不必借助于某种预先确定的数据编码算法,神经网络能够根据图像本身的信息特点,自主地完成图像编码和压缩。

人工神经网络图像压缩方面的应用越来越引起人们的注意,和一些传统的压缩方法相比,人工神经网络技术具有良好的容错性、自组织性和自适应性,因此在图像压缩过程中,不必借助于某种预先确定的数据编码算法,神经网络能够根据图像本身的信息特点,自主地完成图像编码和压缩。

神经网络编码是什么

神经网络编码的分类

目前,在神经网络编码中,使用较多的是三层 BP 网络和自组织映射神经网络 。

BP 网络

采用 BP 网络实现数据压缩好比是强迫数据通过细腰型网络的瓶颈,并期望在网络的瓶颈处能获得较紧凑的数据表示。BP 网络进行数据压缩的原理,将图像先分层 n 个小块,对应于输入的 n 个神经元,压缩后的数据对应于隐含层 m 个神经元,m≦n。通过训练算法在网络学习过程中调整网络的权重,使训练集图像的重建误差 E=X-Z均值达到最小(X 为输入层样本集,Z 为输出层样本集),或者说使重建图像在均方误差意义上尽可能地相似于原始图像。经过训练后的 BP 神经网络便可以用来进行图像压缩。

自组织映射神经网络

自组织映射神经网络中的神经元可以自动根据外部刺激的兴奋点调整自己在由外界信号决定的参数空间中的位置。以一种双层神经网络为例,其中输入层神经元(x1,x2,…,xn)简单反映外部刺激。在输出层中,M 个神经元排布成二维网络,其中每个神经元 j 接收两类输入:来自输入层神经元 i 的输入 xi(权重为 wij)和来自输出层神经元的固定权重。对每一个外界输入矢量 x=( x1,x2,…,xn),只有一个同该输入的距离 di=f(x,wj),wj=(w1j,w2j,…,wnj)为最小的神经元 j 才被激发。其中,距离函数 f(x,wj)反映了在某一准则(一般为平方误差准则)下,矢量 x 与 wj 之间的距离。在网络的训练中只需要提供输入矢量 x,通过调整从公共的外部输入到每个神经元 j 的连接权重 wj,权重矢量将逐渐指向输入矢量空间的聚类。从而实现了输入空间的维数压缩,完成了类似于矢量量化的功能。

总结

除了把神经网络直接用于图像压缩之外,还可以把神经网络同传统的图像压缩编码算法相结合,构成许多间接应用神经网络的图像编码方法。但是,目前人工神经网络的工作原理还不清楚,神经网络的图像编码方法的研究目前仅处于一个初级阶段,需要解决的问题还很多,如完善人工神经网络的理论体系,弄清楚神经网络的工作原理,找到适合图像数据的高效压缩,充分利用视觉信息处理机制的神经网络模型和学习算法。

0个人收藏 收藏

评论交流

泪雪默认头像 请「登录」后参与评论
  1. 加载中..

相关推荐

  • 人脸识别 Face recognition

    三维人脸识别是什么

    三维人脸识别是一种高级的技术,通过采集人脸的三维形态和纹理信息,结合复杂的算法和模型,实现对人脸进行准确识别和分析的过程,它在安全、人机交互、医疗、营销和娱乐等领域具有广泛的应用,可以提高安全性、改善用户体验,并推动创新的应用和服务。
  • 人脸识别 Face recognition

    人脸识别常用的算法和技术有哪些

    有特征提取算法,又分为主成分分析PCA,线性判别分析LDA,局部二值模式LBP;人脸检测算法,分为Viola-Jones算法,基于深度学习的检测算法;人脸对齐技术,有形状对齐和姿态估计;还有人脸识别算法,分为学习型方法和深度学习方法。
  • 达芬奇视频调色软件 DaVinci Resolve

    DaVinci Resolve是什么

    DaVinci Resolve(达芬奇)是一款在同一个软件工具中将剪辑、调色、视觉特效、动态图形和音频后期制作融于一身的视频调色软件。它采用美观新颖的界面设计,易学易用,能让新手用户快速上手操作,还能提供专业人士需要的强大性能。
  • OpenAI

    OpenAI是什么

    OpenAI是一家非营利性人工智能研究公司,致力于研究人工智能和其他机器学习技术。OpenAI 会和谷歌、苹果、IBM 等知名公司创办的其它一系列项目一道探索先进计算机技术,解决面部识别或语言翻译等问题。
  • 手写识别 HandWriting Recognition

    手写识别是什么

    手写识别(HandWriting Recognition)是指将在手写设备上书写时产生的有序轨迹信息化转化为文字的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。
  • 表情识别 Expression recognition

    表情识别是什么

    表情识别是指从给定的静态图像或动态视频序列中分离出特定的表情状态,从而确定被识别对象的心理情绪。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。