(XR导航网 2024年03月07日)在之前的博文中,OpenCV分享了计算机视觉的基础知识,成为计算机视觉工程师的指南,以及计算机视觉研究不同阶段和如何发表研究成果等等
在下面这篇博文中,团队又介绍了2024年你需要的关键AI技能的初学者指南:
介绍
人工智能无疑是科技界最新的进步之一。随着它在从医疗保健到游戏和虚拟现实等广泛行业的发展和应用,行业对人工智能专业人员产生了巨大的需求。但人工智能领域并不是在公园里散步这么简单。
不要担心,本文将涵盖你2024年在人工智能领域取得成功所需的11项人工智能技能。所以我们开始吧。
成功职业所需的技能
2014年,全球人工智能市场的估值为63亿美元。到2024年,这一数字预计将达到惊人的3059亿美元。这可以归因于诸多因素,比如深度学习和算法的突破。结合巨大的计算能力、资源和数据存储,人工智能的发展不会停下脚步。从中小企业到跨国公司,超过80%的企业都在系统中采用人工智能,所以对于想要进入这个领域的人来说,了解所需的基本人工智能技能至关重要。下面我们从硬技能开始。
硬技能
掌握任何领域都需要掌握一套硬技能和软技能。人工智能领域同样不例外。本节将涵盖AI掌握所需的所有硬技能,所以我们不要浪费,马上开始。
1. 数学
一个人需要掌握的首要硬技能之一是数学。为什么数学是AI必须掌握的技能?数学和人工智能有什么关系?
人工智能系统主要是为了实现大部分流程的自动化,更好地理解和帮助人类。人工智能系统由模型、工具、框架和逻辑组成,而它们构成了数学主题。线性代数、统计学和微分等概念都是开启人工智能职业生涯的关键数学主题。我们下面来逐一探索。
1.1 线性代数
线性代数用于解决机器学习模型中的数据问题和计算。这是一个人需要掌握的最重要的数学概念之一。大多数模型和数据集都表示为矩阵。线性代数用于数据预处理、转换和求值。下面我们来看看主要的用例。
1.1.1 数据表示
数据是训练模型的关键第一步。但在此之前,需要将数据转换为数组,然后才能将其输入模型。计算是在这些数组上执行的,这些数组以张量或矩阵的形式返回输出。同样,缩放、旋转或投影中的任何问题都可以用矩阵表示。
1.1.2 向量嵌入
向量用于组织数据,包含幅度和方向。向量嵌入涉及到利用机器学习和人工智能。在这里,一个特定的工程模型会训练成将不同类型的图像或文本转换为向量或矩阵的数字表示。使用向量嵌入可以极大地改善数据分析并获得洞察力。
1.1.3 降维
当我们想要减少数据集中的特征数量,同时保留尽可能多的信息时,可以使用这种技术。通过降维,将高维数据转换为低维空间,这可以降低模型复杂度,并提高泛化性能。
1.2 统计
统计学是另一个数学概念,用于从分析和呈现原始数据中发现看不见的模式。必须掌握的两个常见统计主题如下。
1.2.1 推论统计
推断统计使用样本对较大的数据进行概括。我们可以估计和预测未来的结果。通过利用样本数据,推理统计进行推理操作以做出预测。
1.2.2 描述性统计
在描述性统计中,描述特征,而数据呈现为纯粹的事实。预测是利用分布、方差或集中趋势等指标从已知数据中进行。
1.3 微分学
微分学就是从一个函数求导数的过程。这个导数测量函数速率的变化。在使用深度学习或机器学习算法和模型时,微积分起着至关重要的作用。它们帮助算法从数据中获得洞察力。简单地说,它们处理的是量变化的速率。
微分学同时用于算法优化和模型函数。它们测量当输入变量改变时函数的变化情况。当应用时,从数据中学习的算法会得到改进。
微分学在人工智能中的作用是什么呢?
在人工智能中,我们主要处理成本函数和损失函数。为了找到相关函数,我们需要找到最大值或最小值。要做到这一点,需要对所有参数进行更改,而这非常麻烦,既耗时又昂贵。这就是像梯度下降这样的技术派上用场的地方。它们用于分析输入发生变化时输出如何变化。
事实证明,数学是你的人工智能技能列表中的一个基础步骤,有助于处理数据、学习模式和获得见解。
2. 编程
要想在这个领域取得成功,首先需要掌握的人工智能技能之一就是编程。通过编程,你可以将人工智能理论和概念应用到应用程序中。例如,它可以作为构建深度学习和机器学习模型并对其进行训练的基石。另一个例子是在清洗、分析和操作数据方面的帮助。
有人可能会认为,人工智能的复杂性提高将使得编程技能变得不那么重要。这种系统和算法有其局限性。程序员可以极大地提高系统的效率。随着大多数行业将人工智能纳入其业务,对熟练编码人员的需求非常高。这同时会帮助你在这个竞争激烈的就业市场中保持相关性。
这里涉及大量的编码语言,最常见的是C、C++、Java和Python。
2.1 Python
Python是开发者使用的最流行的编程语言之一。它是一种解释语言,这意味着不需要转译成机器语言指令来运行程序。Python是一种通用的过程语言,可用于各种领域和行业。
为什么Python如此受欢迎?
它与许多操作系统兼容,赋予它非常高的灵活性。另外,人们不需要制定复杂的代码。
Python大大减少了执行代码的行数,减少了执行所需的时间。
它提供了大量预构建的库,如用于科学计算的NumPy和用于高级计算的SciPy。
2.2 C++
C++是一种通用且功能强大的编程语言,可用于构建高性能AI系统。它是程序员中第二受欢迎的选择,特别是在可扩展性和性能至关重要的领域。
它们运行模型的速度比Python等解释性语言快得多。使用C++的另一个好处是它们能够与其他语言和库进行交互。
作为一种编译语言,C++提供了高性能,适合构建需要高计算能力的系统。
C++在性能优化和内存使用方面更容易使用。
另一个优点是C++可以在不同的平台运行,使得在不同的环境中部署应用程序变得很容易。
凭借广泛的库和框架,C++是一种强大而灵活的语言,适合在生产过程中开发深度学习和机器学习。
如上所述,编程语言是在人工智能领域取得成功的第一个基本步骤。下面我们继续下一个AI技能:框架和库。
3. 框架和库
AI中的框架和库指的是提供构建和运行模型所需的所有基本组件的预构建包。它们通常包括算法、数据处理工具和预训练模型。相关框架是实现机器学习和深度学习算法的基础。框架消除了手工编码或从零开始编码的需要,证明了企业构建人工智能应用程序的成本效益。所以为什么要使用AI框架呢?
框架配备了预先实现的算法、优化技术和用于数据处理的实用程序,可以帮助开发者解决特定问题。这简化了应用程序开发流程。
如前所述,框架的成本效益非常高。由于预构建组件的可用性,开发成本大大降低。与传统方法相比,企业能够以更有效的方式和更短的时间创建应用程序。
框架可以大致分为开源框架和商用框架。
开源框架:在开源许可下发布的框架是开源框架。用户可以将其用于任何目的。它们免费使用,通常包括源代码和许可衍生作品。在一个活跃社区的支持下,人们可以找到大量的故障排除和学习资源。
商用框架:与开源框架不同,商用框架是由特定品牌开发和许可。用户可以做的事情受到限制,并可能会征收额外费用。商用框架通常有专门的支持,以防遇到任何问题。由于相关框架由特定的公司拥有,所以可以找到通常以用户为中心的高级功能和优化。
关于框架的类型就讲到这里。下面我们来探索基本的框架和库。
3.1 PyTorch
PyTorch是Meta在2016年开发的一个开源库。它主要用于深度学习、计算机视觉和自然语言处理。由于开发者努力改进其结构,它非常容易学习,使其与传统编程非常相似。由于PyTorch中的大多数任务都可以自动化,所以可以大大提高生产率。PyTorch拥有庞大的社区,为开发人员和研究人员提供了大量支持。GPyTorch,Allen NLP和BoTorch是流行的库之一。
3.2 TensorFlow
TensorFlow是谷歌在2015年开发的一个开源框架。它支持诸多分类和回归算法,并用于机器学习和深度学习的高性能数值计算。AirBnB、eBay和可口可乐等巨头都在使用TensorFlow。它提供了简化和抽象,可以使代码更小、更高效。TensorFlow广泛用于图像识别。另外有TensorFlow Lite,它可以在移动设备和边缘设备部署模型。
3.3 MLX
MLX是苹果开发的一个开源框架,用于在苹果设备部署机器学习模型。与PyTorch和TensorFlow等其他框架不同,MLX提供了独特的功能。MLX专为苹果的M1、M2和M3系列芯片而设计。它利用神经引擎和SIMD指令,与在苹果硬件运行的其他框架相比显著提高了训练和推理速度。其结果是:iPhone、iPad和Mac的体验更流畅、响应更快。MLX是一个功能强大的包,为开发者提供卓越的性能和灵活性。一个缺点是,作为一个相当新颖的框架,它可能无法提供TensorFlow和PyTorch等经验丰富的框架的所有功能。
3.4 SciKit-learn
SciKit-learn是一个免费的、开源的机器学习Python库,建立在NumPy、SciPy和Matplotlib之上。它提供了一个统一和精简的API,并附带全面的文档和教程、数据挖掘和机器学习功能。一旦开发者理解了一种模型类型的基本语法,你就很容易切换到另一种模型或算法。SciKit-learn提供了一个广泛的用户指南,以帮助你快速访问从多标签算法到协方差估计的资源。从更小的原型到更复杂的深度学习任务,它的用例多种多样。
3.5 Keras
Keras是一个开源的高级神经网络API,可以在其他框架之上运行。它是TensorFlow库的一部分,我们可以用几行代码定义和训练神经网络模型。Keras提供了简单而一致的API,减少了运行通用代码的时间。同时,它只需更少的原型时间,这意味着模型可以在更短的时间内部署。优步、Yelp和Netflix等巨头都在使用Keras。
4. 数据工程
21世纪是大数据时代。数据是推动人工智能背后创新的关键因素。它为企业提供简化其流程,并根据其业务目标做出明智决策的信息。随着物联网、社交媒体和数字化的爆炸式增长,数据量急剧增加。但面对如此庞大的数据量,收集、分析和存储数据是相当具有挑战性的任务。这就是数据工程发挥作用的地方。它主要用于构建、安装和维护系统和管道,促进组织有效地收集、清理和处理数据。
我们在前面的一节中介绍了统计学,而它在数据工程中同样扮演着重要的角色。相关基础知识将帮助数据工程师更好地理解项目需求。统计有助于从数据中得出推论。数据工程师可以利用统计度量来度量数据库中数据的使用情况。对描述性统计有一个基本的了解非常好,比如从收集的数据中计算百分位数。
现在我们已经理解了什么是数据工程,我们将更深入地了解数据工程在人工智能中的作用。
4.1 数据收集
顾名思义,数据收集就是从各种来源收集数据,从中提取有见地的信息。我们在哪里可以找到数据?数据可以从各种来源收集,如在线跟踪、调查、反馈和社交媒体。企业利用数据收集来优化工作质量、做出市场预测、寻找新客户并做出有利可图的决策。数据收集有三种方式。
第一方数据收集:在这种形式的数据收集中,直接从客户那里获得数据。这可以通过网站、社交媒体平台或应用程序来实现。第一方数据准确可靠。这种形式的数据收集指的是客户关系管理数据、订阅、社交媒体数据或客户反馈。
第二方数据收集是从受信任的合作伙伴收集数据。这可能是品牌之外的业务收集数据。这与第一方数据非常相似,因为数据是通过可靠的来源获得。品牌利用第二方数据来获得更好的见解并扩大业务规模。
第三方数据收集:在这里,数据是从与业务或客户无关的外部来源收集。这种形式的数据是从各种来源收集的,然后出售给各种品牌,并主要用于营销和销售目的。第三方数据收集提供了比前两种更广泛的受众范围。但这种不一定会在遵守隐私法的情况下收集。
4.2 数据集成
数据集成可以追溯到80年代。其主要目的是使用业务规则抑制关系数据库之间的差异。与今天的云技术不同,那时候的数据集成更多地依赖于物理基础设施和有形存储库。数据集成涉及将来自不同来源的各种数据类型组合到一个数据集中。这可以用于运行应用程序和帮助业务分析。企业可以利用相关数据集做出更好的决策,推动销售,并提供更好的客户体验。
从金融到物流,几乎每个行业都有数据集成。下面我们来探讨不同类型的数据集成方法。
手动数据集成:这是最基本的数据集成技术。通过手工数据集成,我们可以完全控制集成和管理。数据工程师可以进行数据清洗、重新组织,并手动将其移动到理想的目的地。
统一数据访问集成:在这种形式的集成中,数据一致地显示以方便使用,同时将数据源保持在原始位置。它简单,提供统一的数据视图,多个系统或应用程序连接到一个数据源,并且不需要高存储空间。
基于应用的数据集成:在这里,利用软件来定位、获取和格式化数据,然后将数据集成到期望的目的地。这包括预先构建到各种数据源的连接,并能够在必要时连接到其他数据源。使用基于应用程序的数据集成,由于自动化,数据传输可以无缝地进行,并且使用更少的资源。它同时很容易使用,并不总是需要专门的技术知识。
通用存储数据集成:随着数据量的增加,企业正在寻求更常见的存储选择。与统一访问集成非常相似,信息在复制到数据仓库之前要进行数据转换。由于可以随时访问一个位置的数据,我们可以在需要时运行业务分析工具。这种形式的数据集成提供了更高的数据完整性。
中间件数据集成:在这里,集成发生在应用层和硬件基础设施之间。中间件数据集成解决方案将数据从各种应用程序传输到数据库。使用中间件,网络系统可以更好地通信,并且可以以一致的方式传输企业数据。
5. 机器学习方法和算法
计算机程序可以根据它们处理的数据进行调整和进化,这就是机器学习算法。它们称为训练数据,本质上是通过提供给它们的数据进行学习的数学数据。机器学习算法是当今应用最广泛的算法之一。从智能手机到传感器,它们几乎集成到每一种硬件之中。
机器学习算法可以根据其目的以不同的方式分类。我们将逐一深入研究。
5.1 监督式学习
在监督式学习中,机器通过实例学习。他们从先前学习的数据中获得推断,并使用标记数据获得新数据。算法识别数据中的模式并做出预测。算法进行预测,并由开发者进行修正,直到达到较高的精度。监督学习包括:
分类:在这里,算法从观测值中得出推论,并确定新的观测值属于哪个类别。
回归:在回归中,理解各种变量之间的关系,其中重点放在一个因变量和一系列其他变化变量,以使其对预测和预测有用。
预测:这是基于过去和现在的数据做出未来预测的过程。
5.2 无监督学习
在无监督学习中,算法分析数据以获得模式。机器研究可用的数据并推断出相关性。算法解释大数据,并尝试以结构化的方式组织它。无监督学习包括:
降维:这种形式的无监督学习减少了寻找所需信息所需的变量数量。
聚类:这涉及到根据定义的标准对相似的数据集进行分组。
5.3 半监督学习
半监督学习(Semi-Supervised Learning/SSL)这种机器学习技术利用一小部分标记数据和大量未标记数据来训练预测模型。通过这种形式的学习,可以减少手工注释的成本,并限制数据准备时间。半监督学习是连接有监督学习和无监督学习的桥梁,解决了两者之间存在的问题。SSL可以用于从分类和回归到关联和聚类的一系列问题。由于存在大量未标记的数据,并且相对便宜,因此SSL可以用于大量应用程序,而不会影响准确性。
我们下面来探索常见的机器学习算法。
逻辑回归:逻辑回归是一种监督学习的形式,用于根据先前的观察预测是或否的概率。相关预测是基于一个或几个现有的独立变量之间的关系。逻辑回归在数据准备活动中被证明是至关重要的,它在提取、转换和加载过程中将数据集放入预定义的容器以呈现信息。
决策树:决策树是一种监督学习算法,它创建一个流程图,并根据数字预测做出决策。与其他监督学习算法不同,它可以解决回归和分类问题。通过学习简单的决策规则,我们可以预测目标变量的类别或值。决策树十分灵活,并且有各种形式用于业务决策应用程序。它们使用的数据不需要太多的清洗或标准化,同时不需要花费太多时间来训练新数据。
朴素贝叶斯:朴素贝叶斯这种概率机器学习算法用于各种分类问题,如我们训练高维数据集的文本分类。它是一种基于贝叶斯定理的强大预测建模算法。用这种算法建立模型和做出预测要快得多,但它需要很高的专业知识来开发。
随机森林:随机森林这种著名的机器学习算法用于分类和回归任务,并且使用监督学习方法。即便没有超参数调优,它都会产生很好的结果。由于其简单性和多样性,它是机器学习从业者的首选算法。随机森林是一种分类器,它在给定数据集的不同子集中包含多个决策树,并找到平均值以优化该数据集的准确性。
KNN:KNN是一种简单的算法,它存储所有可用的案例并对新数据进行分类。它是一种监督学习分类器,用于利用接近性进行预测。它在分类和回归任务中使用,但通常它用作分类算法。它既可以处理分类数据,又可以处理数值数据,这使得它可以灵活地处理不同类型的数据集,并用于分类和回归任务。由于它的简单性和易于实现,它是开发者的常用选择。
机器学习算法对于利用一个人的人工智能技能和在人工智能领域取得成功的职业生涯非常重要。在本节中,我们介绍了不同类型的计算学习算法和常用技术。下面我们来看看下一个人工智能技能:深度学习。
6. 深度学习
从ChatGPT这样的大型语言模型到特斯拉这样的自动驾驶汽车,人工智能领域最近的进步可以归功于深度学习。
深度学习到底是什么?
深度学习是人工智能的一个子领域,它尝试通过处理数据在机器中复制人类大脑的工作方式。深度学习模型分析文本、图像和其他形式的数据中的复杂模式,从而产生准确的见解和预测。深度学习算法需要数据来解决问题。在某种程度上,它是机器学习的一个子领域。但与机器学习不同的是,深度学习由多层算法构成,称为神经网络。
神经网络是一种尝试复制人脑复杂功能的计算模型。神经网络有多层相互连接的节点来处理和学习数据。通过分析数据中的层次模式和特征,神经网络可以学习数据的复杂表示。
下面将讨论深度学习中常用的架构。
CNN是一种深度学习算法,专为对象检测、图像分割和对象识别等任务而设计。它们可以大规模地自主提取特征,消除了人工特征工程的需要,从而提高了效率。CNN是通用的,可以应用于计算机视觉和NLP等领域。像ResNet50和VGG-16这样的CNN模型可以在数据很少的情况下适应新的任务。
FNN,又称为深度网络或多层感知器MLP,这是一种基本的神经网络,其中输入在一个方向进行处理。FNN是最早同时是最成功的学习算法之一。FNN包括输入层、输出层、隐藏层和神经元权重。输入神经元接收的数据穿过隐藏层,然后离开输出神经元。
RNN是最先进的算法之一,用于处理时序数据,如时间序列和自然语言。它们保持着一种可以捕获之前输入信息的内部状态,这使得它们更适合语音识别和语言转译,比如Siri或Alexa。RNN是处理语音、文本、音频、视频等顺序数据的首选算法。
深度学习包含诸多子类型。
6.1 计算机视觉
计算机视觉(Computer Vision/CV)是近年来另一个蓬勃发展的人工智能领域。我们可以把这归功于今天产生的大量可用数据(每天大约有30亿张图片共享)。计算机视觉可以追溯到50年代。
什么是计算机视觉?计算机视觉是人工智能的一个子领域,它训练机器和计算机像我们一样解读周围环境。简而言之,它赋予了机器视觉的力量。
6.2 自然语言处理NLP
另一个加速深度学习的子领域是NLP,即赋予机器处理和理解人类语言的能力。我们可能都以某种形式使用过NLP技术,例如亚马逊的Alexa或三星的Bixby等虚拟助手。这项技术通常基于机器学习算法来分析示例并根据统计数据进行推断,这意味着机器接收的数据越多,结果就越准确。
NLP如何使企业受益?从新闻报道到社交媒体,NLP系统可以分析和处理来自不同来源的大量数据,并提供有价值的见解来评估品牌的表现。通过简化流程,这项技术可以使数据分析更加高效。
NLP技术以聊天机器人、自动补全工具、语言翻译等多种形式出现。学习掌握NLP的关键方面包括:
数据清洗
标记
字段嵌入
模型开发
拥有强大的NLP和计算机视觉基础知识可以打开高薪职位的大门,如计算机视觉工程师,NLP工程师,NLP分析师等等。
7 部署
模型部署是将上述所有步骤联系在一起的最后一步。它是在一个有限的环境中促进无障碍及其操作的过程,在这个环境中,它们可以做出预测并获得见解。在这里,模型集成到更大的系统中。相关预测可供公众使用。这可能会因为不同的原因而构成挑战,比如测试或模型开发和训练之间的差异。但有了正确的模型框架、工具和过程,所述问题是可以克服的。
传统而言,模型部署在本地服务器或机器,这限制了它们的可访问性和可扩展性。快进到今天,有了像Amazon Web Services和Azure这样的云计算平台,部署变得更加无缝。它们改进了如何部署模型、管理资源,以及如何处理扩展和维护的复杂性。
下面我们来看一下模型部署的核心特性。
可扩展性:模型可扩展性是指模型在不影响性能或准确性的情况下处理大量数据的能力。它涉及到:
根据需求在云平台上扩展或缩小
它确保了最佳性能,并使其更具成本效益
提供负载平衡和自动扩展,这对于处理不同的工作负载和确保高可用性至关重要
帮助评估系统是否能够处理不断增加的工作负载,以及它的适应性如何
可靠性:这是指模型以最小的错误执行预期任务的效果。可靠性取决于几个因素。
冗余是在发生故障或不可用的情况下对关键资源进行备份
监控是为了在部署期间评估系统并解决出现的任何问题
测试在系统部署前后验证系统的正确性
错误处理是指系统如何在不影响功能和质量的情况下从故障中恢复
7.1 云部署
下一步是选择特定于我们需求的部署环境,比如成本、安全性和集成功能。云计算在过去十年中取得了长足的进步。在最初几年,云模型部署选项非常有限。
什么是云部署?它是分布式框架的所有权和可访问性等不同变量的安排。作为一个虚拟计算环境,我们可以根据想要存储的数据量和谁控制基础设施来选择部署模型。
7.2 私有云
这是公司建立、运营和拥有其数据中心的地方。跨国公司和大品牌通常采用私有云来实现更好的定制和合规性要求,但这需要在软件和人员方面进行投资。私有云最适合希望对数据和资源有充分控制并能控制成本的公司。它是存储只有授权人员才能访问的机密数据的理想选择。
7.3 公共云
公共云部署涉及托管基础设施和软件共享数据中心的第三方提供商。与私有云不同,它可以节省基础设施和人员成本。公共云易于使用且更具可扩展性。
7.4 混合云
它是一种结合了私有云和公共云的云类型。它们促进了数据和应用程序在两个环境之间的移动。混合平台提供更多的:
灵活性
安全
部署选项
合规性
选择合适的公共云提供商可能是一项艰巨的任务。所以,下面我们将介绍目前主导市场的主要厂商:
Amazon Web Services:由亚马逊开发的AWS于2006年推出,是云计算行业的首批先驱之一。AWS在全球245个国家拥有超过200项云服务,以32%的市场份额位居榜首。可口可乐、Adobe和Netflix等巨头都在使用它。
谷歌云平台:于2008年推出,最初作为“应用引擎”,并在2012年成为谷歌云平台。如今,它拥有120个云服务,这对开发者来说是一个不错的选择。计算引擎是它最好的功能之一,并且支持任何操作系统,可提供自定义和预定义的机器类型。
微软Azure:Azure于2010年推出,在46个地区提供传统云服务,在云市场占有第二高的份额。你可以快速部署和管理模型,部署和管理模型,并共享跨工作区协作。
7.5 监控模型性能
一旦部署了模型,下一步就是监控模型。
为什么要监控模型的性能?模型通常会随着时间的推移而退化。从部署开始,模型的性能开始缓慢下降。这样做是为了确保它们按照预期一致地执行。在这里,我们跟踪已部署模型的行为,并从中进行分析和推断。接下来,如果模型需要在生产中进行任何更新,我们需要一个实时视图来进行评估。这可以通过验证结果来实现。
监控可分为:
在操作级监控中,需要确保用于系统的资源是健康的,如果不正常,将对其进行操作。
功能级监控是我们监控输入层、模型和输出预测的地方。
7.6 资源优化
资源优化是模型部署的一个关键方面。这在资源有限的情况下尤其有用。优化资源的一种方法是对模型本身进行调整。让我们来探讨几种方法。
简化:优化模型的一种方法可能是采用具有更简单、更少组件或操作的模型。我们该怎么做呢?通过使用以下提到的功能:
具有较小架构的模型
具有更少层的模型
具有更快激活函数的模型
修剪:修剪是去除模型中不需要的、对输出贡献不大的部分的过程。它包括减少模型中的层数或连接数,使其更小、更快。常见的修剪技巧包括Weight Pruning和Neuron Pruning。
量化:模型量化是使模型更加优化的另一种方法。这涉及到减少模型中使用的数值的位宽度。与之前的模型优化方法一样,量化可以降低模型的内存和存储需求,同时可以提高推理速度。
以上总结了走上人工智能道路所需的硬技能。但等等,还有更多。我说的是软技能。软技能到底是什么?为什么它们很重要?下一节将详细讨论这一点。
软技能
软技能是一个人除了专业知识之外还需要具备的“非必需品”。软技能是我们每个人内在的能力,它不是我们从书本或课程中学到的技能。软技能是你的技术能力和你的雇主或同事之间的桥梁。换句话说,你如何有效地沟通和合作。根据德勤的调查,92%的品牌表示软技能与硬技能的重要性相当。它们展示了一个人在公司内部进行内部沟通、领导团队或做出决策以提高业务绩效的能力。
下面我们来探讨关键的软技能,一个人必须拥有的优势。
8. 解决问题
你为什么会被录用?用你在你的领域的专业知识来解决问题。这是另一项重要的软技能,它要求人们识别问题、分析问题并实现解决方案。这是最受欢迎的技能之一,86%的雇主在寻找具备这一技能的简历。归根结底,公司总是在寻找能够解决他们问题的人才。任何善于解决问题的人在就业市场上都是有价值的。
9. 批判性思维
随着越来越多的自动化过程的出现,对于领导者和专家来说,解释和情景化结果并做出决策变得至关重要。批判性思维有助于评估结果,提供事实性的回应。逻辑推理有助于识别系统中的任何差异。这涉及到理性思维的混合,将相关的与不相关的分离开来,考虑所获得信息的背景,并思索其含义。因此,它涉及到通过分析各种解决方案的利弊来解决复杂的问题,你需要使用逻辑和推理,而不是直觉。
10. 求知欲
求知是一个人职业生涯的重要组成。它是一种探索事物、提出问题、深入钻研的渴望。好奇心促使人们走出自己的舒适区,在自己的专业领域探索未知的领域。尽管人工智能系统可以从大量数据中进行分析和推断,但它们缺乏理解或质疑的能力。一个人探究得越多,就越能带来创新。
11. 道德决策
有了今天的海量数据,人工智能系统可以操作大型数据集,并从数据中得出的模式进行推断。然而,我们不能依靠系统来做出正确或公平的决定,因为它们可能依赖于社会偏见。如果不加以注意,偏见可能会导致组织歧视,因为不公平现象会持续下去。
这就是道德决策发挥作用的地方。它阐明了一个人确保结果保障一个或多个个人的自由并符合社会规范的能力。这确保部署的系统不会以侵入性或有害的方式使用。
结论
在本文,我们涵盖了所有基本的硬技能,如编程和深度学习,以及软技能,如批判性思维和解决问题的能力。希望这篇文章能给你带来洞察力和正确的心态,帮助你开始利用人工智能技能的旅程。下期节目再见。