
PyTorch 图像裁剪
torchvision 提供了一些用于图像裁剪的方法,这些方法也可以用于图像增强。主要介绍下: 1. PIL 和 Tensor 转换 2. 多种图像裁剪方法 1. PIL 和 Tensor 转换 {#title-0} ============================= 处理图像之前,需要先读取图片。我们可以使用 torchvision.io.image 模块的 r...
torchvision 提供了一些用于图像裁剪的方法,这些方法也可以用于图像增强。主要介绍下: 1. PIL 和 Tensor 转换 2. 多种图像裁剪方法 1. PIL 和 Tensor 转换 {#title-0} ============================= 处理图像之前,需要先读取图片。我们可以使用 torchvision.io.image 模块的 r...
<p>我们在使用 PyTorch 建网络模型时,网络层与层之间很多都是使用不同的 shape 进行运算,我们需要掌握对张量形状的操作,以便能够更好处理网络各层之间的数据连接。</p> <ol> <li> <p>reshape 函数</p> </li> <li> <p>tr...
<p>张量的拼接操作在神经网络搭建过程中是非常常用的方法,例如: 在残差网络、注意力机制中都使用到了张量拼接。</p> <ol> <li> <p>torch.cat 函数的使用</p> </li> <li> <p>torch.stack 函数的使用</p> &...
<p>我们在操作张量时,经常需要去进行获取或者修改操作,掌握张量的花式索引操作是必须的一项能力。</p> <pre><code>import torch data = torch.randint(0, 10, [4, 5]) print(data) print('-' * 50) # 1. 简单行、列索引 ...
``` import torch import numpy as np # 1. 张量和 numpy 的转换 def test01(): data_tensor = torch.tensor([2, 3, 4]) # 将张量转换为 numpy 数组 data_numpy = data_tensor.numpy() # data_tenso...
<p>PyTorch 计算的数据都是以张量形式存在, 我们需要掌握张量各种运算. 并且, 我们可以在 CPU 中运算, 也可以在 GPU 中运算.</p> <ol> <li> <p>基本运算</p> </li> <li> <p>阿达玛积</p> </li...
*前言* {#%E5%89%8D%E8%A8%80} -------------------------- > 随着项目越来越大,市面上所使用的五花八门插件库也越来越多,随便一个项目都少说会1w+行代码以上,导致项目维护越来越差。尤其上在开发原生`JavaScript`的时候从中找`Bug`更是难如登天。`TypeScript`犹如`the Saviour`让更多开发者...
<p>FFmpeg 是一个功能强大、开源的音视频处理工具,可以满足用户在音视频处理方面的各种需求。可以用于录制、转换、编辑、播放和流媒体处理等。它是一个跨平台的工具,支持 Windows、Mac、Linux 等操作系统。</p> <p>FFmpeg 可以处理多种格式的音视频文件,包括常见的 AVI、MP4、MOV、FLV、WMV、MKV 等格...
当我们打开一个多媒体文件时,FFmpeg 会用 AVCodecContext 结构体来存储文件的一些信息和参数,用于后续对文件的一系列操作。本篇就简单介绍下,如何使用 FFmpeg 打开和关闭一个多媒体文件。我们的操作步骤如下: 1. 打开多媒体文件 2. 探索多媒体文件更多信息 3. 关闭多媒体文件 在这个过程中涉及到如下的函数: 1. 打开:avformat_open...
本篇简单介绍下,如何从输入多媒体中读取或者写入一帧数据。由于我们并没有进行编解码操作,这里的读写操作都是编码后的数据。在 FFmpeg 中每一帧数据是由 AVPacket 来表示。读操作需要用到的函数有: 1. avformat_open_input 2. av_packet_alloc 3. av_read_frame 4. av_packet_unref 5. avfor...