创新及产品管理能力建设项目 – 第 52 页 – 联合国创新及产品管理能力建设项目(UNSDGT)

什么是TPU？

TPU（Tensor Processing Unit）是谷歌公司开发的专用硬件加速器，专为高效执行张量运算而设计。张量是深度学习中用于表示数据和权重的多维数组结构，TPU作为一种应用特定集成电路（ASIC），优化了矩阵乘法和卷积等核心操作， […]

GPU加速（GPU Acceleration）是指利用图形处理单元（GPU）的并行计算架构来加速数据处理任务的技术。与中央处理单元（CPU）不同，GPU拥有数千个小型核心，能够同时执行大量简单运算，特别适合于矩阵操作和大规模数据并行处理，从 […]

模型性能优化是指在人工智能模型的开发和应用过程中，通过调整模型结构、训练策略或部署方式，以提升其在关键指标上的表现，如预测准确度、推理速度、资源效率和鲁棒性。优化的核心目标是使模型在特定任务中达到最佳平衡，即在保证高精度的同时，降低计算成本 […]

持续集成/持续部署(CI/CD)是一种软件开发实践，通过自动化流程频繁地集成代码更改、运行测试和部署软件，以实现高效、可靠的软件交付。持续集成(CI)强调开发人员定期将代码提交到共享仓库，并自动执行构建和测试以早期发现错误；持续部署(CD) […]

模型版本控制是指在人工智能开发中，对机器学习模型的多个迭代版本进行系统化管理、追踪和控制的实践，类似于软件工程的版本控制系统。它通过记录模型代码、训练数据、超参数及相关元数据的变更历史，实现协作开发、历史追溯、错误回滚和部署控制，从而确保模 […]

Kubernetes（常简称为K8s）是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用程序。它由Google设计并捐赠给云原生计算基金会（CNCF），成为现代云原生架构的核心技术，通过提供负载均衡、自动扩缩容、故障恢复等功能， […]

Docker是一种开源的容器化平台，它允许开发者将应用程序及其所有依赖项（如库、框架和配置文件）打包到一个轻量级、可移植的容器中。容器在运行时共享宿主操作系统的内核，但通过命名空间和控制组等机制实现资源隔离，确保应用在任何环境中都能一致运行 […]

容器化（Containerization）是一种操作系统级别的虚拟化技术，它将应用程序及其所有依赖项（如库、运行环境和配置文件）打包成一个独立的容器单元。容器共享主机操作系统的内核，但通过命名空间和控制组等隔离机制确保每个容器运行在独立的环 […]

弹性伸缩（Elastic Scaling）是一种在云计算或分布式系统中，根据实时工作负载动态调整资源容量（如计算实例、内存或带宽）的技术机制，它能够自动在需求高峰时扩展资源以维持性能，在需求低谷时缩减资源以降低成本，从而实现资源利用的最优化 […]

负载均衡（Load Balancing）是一种网络技术，用于将传入的流量、请求或计算任务均匀分配到多个服务器或资源上，以优化资源利用率、最大化系统吞吐量、最小化响应时间，并防止单点过载导致的故障。它通过智能分发工作负载，确保系统的高可用性、 […]