人工智能基础

一.选择题

1.[答案]: D
[解析]:人工智能三大学派是符号主义、连接主义和行为主义。

2.[答案]:B
[解析]:卷积神经网络的实际发明者是Kunihiko Fukushima,但 Yann LeCun 是第一个用反向传播训练卷积神经网络的人,即现在常用的卷积神经网络。

3.[答案]:C
[解析]:1986年,David Rumelhart、Gcoffrey Hinton、Ronald Williams、David Parker 和 Yann LeCun 提出多层网络中的反向传播算法。

4.[答案]: D
[解析]:深度学习三巨头”是Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton,他们共同获得了2018年的图灵奖。
5.[答案]: D
[解析]: 在卷积神经网络中,权值共享是指对于网络中的某个卷积层,所有神经元都使用同一组卷积核进行卷积操作。 这样的设计减少了网络参数的数量,降低了模型的复杂度,并且增强了模型的学习能力。对于循环神经网络,如图,神经网络的不同时刻的计算权重W,U,V是一样的,这就意味着这些权重是每个时刻共享的。
在这里插入图片描述

 

二.判断题

1.[答案]错
[解析]: 虚拟现实是Virtual Reality,增强现实是 Augumented Reality,二者于不等价。

2.[答案]:错
[解析]:知识图谱是一种大规模的知识表示,基于大数据知识工程的知识图谱是符号主义学派的代表性成果。

3.[答案]:对

4.[答案]:错
[解]:辨认是指从存储库中确定待识别人身份的过程,是一对多的问题;
确认是指将待识别人信息与存储库中特定单人信息进行比对,确定是否是同一个人,是一对一的问题。

 

三. 填空题

1.数据量爆发性增长、计算能力大幅提升、深度学习等算法发展、移动AI创新应用牵引
2.三维视觉
3.2017年
4.1956年
5.2022年
6.2021年

四.解答题

1.什么是人工智能?人工智能的意义与目标是什么?

人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法和技术及应用系统的一门新的技术科学。

人工智能的概念很宽泛,根据人工智能达到的水平将其分为“弱人工智能”、“强人工智能"和“超人工智能三类。每种分类下人工智能要达到的目标不同,“弱人工智能下要达到的目标是根据人类设计的算法依托计算机进行基本逻辑推理从而解决特定问题。强人立智能”的目标是可以胜任人类所有的工作,能够进行思考和解决问题等。“超人工智能的目标是创造出一种在科学创新、通识和社交技能等方面都比人类大脑聪明很彩的智鲜。

2.驱动新一代人工智能发展与进步的因素有哪些?

  1. 数据量爆发性增长
    物联网、移动物联网的快速发展极大地提高了数据的获取效率,每时每刻都可以捕捉、传输、存储和管理海量数据,数据规模呈现爆发式增长。

  2. 计算能力大幅提升

  • 随着GPU(Grmgphics Frocesng Uni)芯片普及,计算机的并行计算能力迈入新阶段。GPU的并行计算能力可同时处理人工智能算法所需要的大量数据,提升计算效率的同时随之带来了神经元网络连接的数目出现了巨大增长,加速了人工智能产业的发展历程。
  • TPU(Tensorflow Processing Unit),TPU是为训练Tensorflow深度学习模型而推出的专用处理器,可以为神经网络处理大量乘法和加法运算,同时速度很快,能耗和物理空间占用也很小。
  1. 深度学习等算法发展
    数据规模的增长和计算能力的提升给深度学习、强化学习(Reinforcement Learning,RL)和迁移学习(Transfer Learing, TL)的发展提供了必要条件,这些算法广泛应用于计算机视觉、语音识别、自然语言处理各个领域,使越来越多复杂和动态场景的需求得到了满足。

  2. 移动AĮ创新应用举引
    移动互联网与智能手机的结合为新一代人工智能插上了腾飞的翅膀,产生了全新的应用,如语音购物人脸支付、无人超市、自动驾驶等各类智能产品,提高了商业服务效率和质量,极大推进万人上智能产业的良性发展和惠民应用。

3.人中智能有哪三大流派?各种流派有哪些特点和代表性研究成果?

人工智能的三大学派分别是符号主义、连接主义和行为主义学派。

  1. 符号主义学派
    符号主义研究者认为人工智能起源于数理逻辑,发展经历了启发式算法 → 专家系统 → 知识工程理论与技术,尤其是专家系统的成功开发与应用,为人工智能实现理论联系实际并走向工程应用具有特别重要的意义。基于**大数据知识工程的知识图谱(KnowledgeGraph)**是符号主义学派人工智能的代表性应用成果。

  2. 连接主义学派
    神经元之间错综复杂的连接被认为是人类智慧的来源,连接主义研究者 认为神经网络和神经网络之间的连接机制能产生智能。 2006年Hinton
    首次提出深度信念网络,将深度学习推向学术界,并成为当前人工智能领域非常热门的研究方向,目前人工智能领域取得的大量应用和突破性进展都采用了深度神经网络的相关算法。

  3. 行为主义学派
    行为主义研究者认为人工智能源于控制论,控制论把神经系统的工作原理与信息理论、控制理论、逻辑和计算机联系起来。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,如对自寻优、自适应和自学习等控制论系统的研究。当前最引人注目的研究成果是波士顿动力机器人。

 

4.新一代人工智能的关健技术有哪些?

新一代人工智能的关健技术主要包括:

  1. 机器学习与深度学习

    • 机器学习是人工智能技术的核心, 基于数据的机器学习是现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或者无压观测的费据进行预测。
    • 深度学习是机器学习的一个子集,利用多层神经网络从大量数据中进行学习。深度学习在搜索技术、数据挖掘、机器翻译、自然语言理解、语音识别、推存和个性化技术及其他许多相关领域都取得了很多成果,使人工智能相关技术取得了巨大进步。
  2. 计算机视觉
    计算机视觉是使用计算机模仿人类视觉系统的科学,让算机拥有人类提取、处理、理解和分析图像及图像序列的能力。自动驾驶、机器人、图片理解、视频理解、智慧医疗等领域均需通过计算机视觉技术从视觉信号中提取并处理信息。

  3. 自然语言处理
    自然语言处理是计算机科学领域与人工智能领域中个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学和数学于一体的科学,主要包括机器翻译、语义理解和问答系统等。

  4. 知识图谱
    知识图谱本质上是结构化的语义知识库:是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是实体一关系一实体的三元组以及实体及其相关**“属性一值”**对。知识图谱的应用场景非常广泛,可以用于语义搜索、智能问答、个性化推荐等。

  5. SLAM技术
    同步定位与建图(Simultaneous Localization and Mapping,SLAM)技术是目前市场上使用较为广泛的室内定位与导航技术,采用该技术运动物体可以根据传感器的信息,一边计算自身位置,一边构建环境地图或环境模型,这一过程解决了机器人在未知环境下运动时的定位和地图构建问题。

  6. 人机交互(Human-ComputerInteraction)
    主要研究人与计算机之间的信息交换,包括人到计算机和计算机到人的两部分信息交换,是人工智能领域重要的外围技术。新型的人机交互包括语音交互、情感交互、体感交互和脑机交互等。人机交互机器人广泛用于娱乐场所、家庭及商场等。

  7. VR/AR/MR技术
    虚拟现实(Virtual Rcality, VR)、增强现实(Augumented Reality,AR)、混合现实(MixedRealiy,.MR)是以计算机为核心的新型视听技术。结合相关科学技术,在一定程度上生成与真实环境在视觉、听觉、触觉等方面高度相似的数字化环境,用户借助必要的设备,与环境中的对象进行交互,互相影响,获得近似真实环境的感受和体验。通过VR/AR/MR 技术构建基于移动端的真实场景虚拟叠加、虚拟环境对象无缝融合、全方位自然交互体验将是未来人工智能应用领域的一个发展趋势。

 

5.自然语言处理面临哪些挑战?

自然语言处理主要面临以下四个挑战:

  1. 普遍存在的不确定性:词法、句法、语义、语用和语音各个层面。
  2. 未知语言现象的不可预测性:新的词汇、术语、语义和语法等。
  3. 数据资源的不充分使其难以覆盖复杂的语言现象。
  4. 语义知识的模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大的非线性计算。

 

6.计算机视觉的发展面临哪些挑战?

计算机视觉的发展面临以下三个挑战:

  1. 一是如何在不同的应用领域与其他技术更好地结合,进而提高识别精度。
    • 计算机视觉在解决某些问题时可以广泛利用大数据,已经逐渐成熟并超过人类,如图像分类目标检测、图像分制等,
    • 但一些非常细粒度的分类:非常小和模糊的目标检测和分割,以及如何保证在复杂光照变化下结果的稳定性等情况精度较低。
  2. 二是如何降低计算机视觉算法的开发时间和人力成本,目前计算机视觉算法的开发需要大量人工标注的数据,导致需要较长的研发周期才能达到应用领域所要求的精度和耗时。
  3. 三是如何加快新型算法的设计开发,随者新的成像软件和人工智能芯片的出现、针对不同芯片和数据采集设备的计算机视觉算法的设计和开发也是挑战之一。

 

7.请简单介绍人工智能的发展历程。
具体将人工智能的发展分为6个阶段:

  1. 起步发展期:1956年-20世纪60年代初。1956年达特茅斯会议召开,标志着人工智能的诞生。该阶段计算机在进行推理和探索时鲰得较大进展,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个浪潮。
  2. 反思发展期:20 世纪60-70年代初。推理和探索能解决较简单问题,但对现实问题束手无策,如无法用机器证明两个连续函数立和仍是连续函数、机器翻译闹出笑话等,人工智能发展陷入低谷。
  3. 应用发展期:20世纪70年代初到80年代中。**专家系统模拟人类专家的知识和经验解决特定领域问题,**实现了人工智能理论研究走向实际的应用,并在医疗、化学和地质等领域取得成功,推动人工智能进久第二个发展浪潮。
  4. 低迷发展期:20世纪80年代中-90年代中。知识描述和知识管理的缺陷逐渐暴露,如应用领域狭窄、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容,人工智能发展进入第二次低谷
  5. 稳步发展期:20实际90年代中-2010年。随着网络技术特别是互联网技术的发展,人工智能技术进一步走向实用化。1997年IBM深蓝超级计算机战胜国际象棋冠军卡斯帕罗夫和2008年IBM提出“智慧地球”都是这一时期的标志事件。
  6. 蓬勃发展期:2011年至今。随着大数据、云计算、互联网、5G通信等新一代信息技术的发展,图像分类、语音识别、知识问答、人机对弈和无人驾驶等人工智能技术实现了从“不能用、不好用"到“可以用”的技术突破,迎来爆发式增长的新浪潮。

 
8.如何解决欠拟合问题?

  1. 增加新特征,可以考虑加入特征组合、高次特征,以此增大假设空间。
  2. 添加多项式特征,这个在机器学习算法中用的很普遍,例如将线性模型增加二次项 或三次项特征使得模型泛化能力更强。
  3. 减少正则化参数,正则化的目的是防止过拟合,出现欠拟合要减少正则化参数。
  4. 使用非线性模型,例如支持向量机、决策树、深度学习等模型。
  5. 增大模型参数量,提高模型的拟合能力。
  6. 调整模型容量,例如集成学习方法,将多个弱学习器 Bagging.

9.模型过拟合有哪些解决办法?

过拟合常见的解决办法有以下几种:

  1. 权值衰减,迭代过程中以某个小因子降低权值。
  2. 采取 Early-Stopping,让模型不要过度训练。
  3. 正则化,在目标函数的基础上增加正则项,如L1正则与L2正则等。
  4. 减少模型参数,降低模型的拟合能力。
  5. 加 dropout.
  6. 数据增强,增加数据量
  7. 决策树剪枝

10.已知网络结构,具体前向传播为 J = − [ y ∗ log ⁡ y + ( 1 − y ∗ ) log ⁡ ( 1 − y ) ] J = - [ y ^ { * } \log y + ( 1 - y ^ { * } ) \log ( 1 - y ) ] J=[ylogy+(1y)log(1y)] , 求 y = 1 1 + exp ⁡ ( − a ) , a = ∑ j = 0 D θ j x j , 求 d J d θ j y = \frac { 1 } { 1 + \exp ( - a ) } ,a = \sum _ { j = 0 } ^ { D } \theta _ { j } x _ { j }, 求\frac { d J } { d \theta _ { j } } y=1+exp(a)1,a=j=0Dθjxj,dθjdJ.,

 

11.梯度下降是目前神经网络中常见的优化思路,请对基于单样本的随机梯度下降、基于所有样本的批量度下降以及基于小批量样本的梯度下降在计算性能、优化效果上的差异进行简单陈述。

  • 随机梯度下降每次只选择一个样本计算梯度方向,计算速度快,但其梯度容易受到干扰,导致训练不稳定,一般需要比较多的迭代次数才能获得较好的效果。

  • 批量梯度下降每次选择所有样本计算梯度方向,能够保证收敛到极值,但每次计算需要处理全部数据,计算时间比较长,但可以进行并行计算。同时因为所有样本的梯度确定,缺乏随机性,难以逃出局部最优,从而使得效果较差。

  • 小批量样本的梯度下降每次选择一个 batch 的样本计算梯度方向,较基于所有样本的批量梯度下降的方法更快,比随机梯度下降稳定。该方法为目前深度学习网络训练的常用思路。

 

12.卷积层相比全连接层有什么优势?这些优势和图像自身的特点有哪些关系?

卷积层的两大特点是局部连接和权值共享。

  1. 卷积层中相邻层中神经元之间的连接是局部的,而全连接层将整个图像作为输入。对于图像来说,相近的像素或区域具有更强的相关性;因而使用卷积提取图像特征更合理。
  2. 卷积层可以进行权值共享,处理图像不同区域的参数相同,而全连接层对不同区域的参数则可能不同。图像中的物体具有平移不变性(ing),因而权值共享更适合处理图像。
  3. 在计算复杂度上,卷积层比全连接层具有更少的参数量,计算量更少,更容易训练。

 

13.将卷积神经网络从VGGNetl6 层增加到34层,结果发现效果变差了。你能分析可能的原因,并且针对网络设计提出合理的改进么?

网络层数增加,效果变差可能是出现了梯度消失的情况,可以使用残差连接等方式避免梯度消失的情况。

Logo

openvela 操作系统专为 AIoT 领域量身定制,以轻量化、标准兼容、安全性和高度可扩展性为核心特点。openvela 以其卓越的技术优势,已成为众多物联网设备和 AI 硬件的技术首选,涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。

更多推荐