Skip to main content

moregeek program

还能这么玩?将prompt tuning用于细粒度的图像检索!_wx6317028f762da的博客-多极客编程

还能这么玩?将Prompt Tuning用于细粒度的图像检索!【写在前面】细粒度对象检索旨在学习判别表示以检索视觉上相似的对象。然而,现有的最佳性能作品通常在语义嵌入空间上施加成对的相似性,以在有限的数据体系中不断调整整个模型,从而导致容易收敛到次优解。本文提出了细粒度检索提示调优算法(FRPT),该算法从样本提示和特征自适应的角度出发,利用冻结的预训练模型来执行细粒度检索任务。具体地说,FRPT

Read More

notebook交互式完成目标检测任务_华为云开发者社区的博客-多极客编程

摘要:本文将介绍一种在Notebook中进行算法开发的新方式,新手也能够快速训练自己的模型。目标检测是计算机视觉中非常常用且基础的任务,但是由于目标检测任务的复杂性,往往令新手望而却步。本文将介绍一种在Notebook中进行算法开发的新方式,新手也能够快速训练自己的模型。通过本文,你将能够体验到:在notebook中通过鼠标就能够进行图片和视频的交互式推理通过参数化及交互式的开发方式一步步搭建训练

Read More

跟我学python图像处理丨傅里叶变换之高通滤波和低通滤波_华为云开发者社区的博客-多极客编程

摘要:本文讲解基于傅里叶变换的高通滤波和低通滤波。本文分享自华为云社区《​​[Python图像处理] 二十三.傅里叶变换之高通滤波和低通滤波​​》,作者:eastmount 。一.高通滤波傅里叶变换的目的并不是为了观察图像的频率分布(至少不是最终目的),更多情况下是为了对频率进行过滤,通过修改频率以达到图像增强、图像去噪、边缘检测、特征提取、压缩加密等目的。过滤的方法一般有三种:低通(Low-pa

Read More

easynlp带你实现中英文机器阅读理解_阿里云计算平台团队的博客-多极客编程

作者:施晨、黄俊导读机器阅读理解是自然语言处理(NLP),特别是自然语言理解(NLU)领域最重要的研究方向之一。自1977年首次被提出以来,机器阅读理解已有近50年的发展史,历经“人工规则”、“传统机器学习”、“深度学习”、“大规模预训练模型”等多个发展阶段。机器阅读理解旨在帮助人类从大量文本中,快速聚焦相关信息,降低人工信息获取成本,增加信息检索有效性。作为人工智能在自然语言理解方向上的“集大成

Read More

mm2022 | 用stylegan进行数据增强,真的太好用了_wx6317028f762da的博客-多极客编程

MM2022 | 用StyleGAN进行数据增强,真的太好用了【写在前面】本文研究了生成文本-图像对的开放性研究问题,以改进细粒度图像到文本跨模态检索任务的训练,并提出了一种通过揭示StyleGAN2模型隐藏的语义信息来增强配对数据的新框架。具体来说,作者首先在给定的数据集上训练StyleGAN2模型。然后,将真实图像投影回StyleGAN2的潜在空间,以获得潜在代码。为了使生成的图像具有可操作性

Read More

跨模态学习能力再升级,easynlp电商文图检索效果刷新sota_阿里云计算平台团队的博客-多极客编程

作者:熊兮、欢夏、章捷、临在​导读多模态内容(例如图像、文本、语音、视频等)在互联网上的爆炸性增长推动了各种跨模态模型的研究与发展,支持了多种跨模态内容理解任务。在这些跨模态模型中,CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。在先前的工作(​​

Read More

cbmi 2022 | 蒸馏细粒度对齐分数以实现高效的图文匹配和检索_wx6317028f762da的博客-多极客编程

CBMI 2022-《ALADIN》-蒸馏细粒度对齐分数以实现高效的图文匹配和检索【写在前面】在涉及视觉和语言的共同理解的任务中,图像-文本匹配正在发挥主导作用。此任务通常被用作预训练目标,以打造能够共同处理图像和文本的体系结构。尽管如此,它有一个直接的下游应用程序: 跨模态检索,它包括查找与给定查询文本相关的图像,反之亦然。解决此任务在跨模态搜索引擎中至关重要。许多最近的方法为image-tex

Read More

2.69分钟完成bert训练!新发cann 5.0加持_华为云开发者社区的博客-多极客编程

摘要:快,着实有点快。 现在,经典模型BERT只需2.69分钟、ResNet只需16秒。 啪的一下,就能完成训练!本文分享自华为云社区《​​这就是华为速度:2.69分钟完成BERT训练!新发CANN 5.0加持,还公开了背后技术​​》,作者:昇腾CANN。快,着实有点快。现在,经典模型BERT只需2.69分钟、ResNet只需16秒。啪的一下,就能完成训练!这是华为全联接2021上,针对异构计算架

Read More

easycv带你复现更好更快的自监督算法-fastconvmae_阿里云计算平台团队的博客-多极客编程

作者: 夕陌、谦言、莫申童、临在导读自监督学习(Self-Supervised Learning)利用大量无标注的数据进行表征学习,在特定下游任务上对参数进行微调,极大降低了图像任务繁重的标注工作,节省大量人力成本。近年来,自监督学习在视觉领域大放异彩,受到了越来越多的关注。在CV领域涌现了如SIMCLR、MOCO、SwAV、DINO、MoBY、MAE等一系列工作。其中MAE的表现尤为惊艳,大家

Read More

阿里云大数据助力知衣科技打造ai服装行业核心竞争力_阿里云计算平台团队的博客-多极客编程

公司简介杭州知衣科技有限公司是一家以人工智能技术为驱动的国家高新技术企业,致力于将数据化趋势发现、爆款挖掘和供应链组织能力标准化输出,打造智能化服装设计的供应链平台。知衣成立于2018年2月,同年获得千万美金A轮融资;2021年完成由高瓴创投、万物资本领投的2亿人民币B轮融资,同年入围“杭州市准独角兽企业榜单”。知衣凭借图像识别、数据挖掘、智能推荐等核心技术能力,不断升级服务体系,自主研发了知衣、

Read More

vs code摸鱼神器,让你快速开发ai模型_华为云开发者社区的博客-多极客编程

摘要:ModelArts VS Code插件一键接入云上开发环境介绍及操作指导对于习惯于使用本地VS Code IDE的开发者,受限于本地资源,采用本地开发加云上调测的远程开发方式不失为一种更好的选择。对比一下本地开发和远程开发的优劣可以看到,本地+远程结合的方式可以同时享受IDE工程化开发的优势和云上资源的即开即用,优势互补,最大程度地满足开发者需求。通过本地IDE加ModelArts提供的远程

Read More

easynlp玩转文本摘要(新闻标题)生成_阿里云计算平台团队的博客-多极客编程

作者:王明、黄俊导读文本生成是自然语言处理领域的一个重要研究方向,具有丰富的实际应用场景以及研究价值。其中,生成式文本摘要作为文本生成的一个重要子任务,在实际应用场景中,包括新闻标题生成、摘要生成、关键词生成等任务形式。预训练语言模型,如BERT、MASS、uniLM等虽然在NLU场景中取得了令人瞩目的性能,但模型采用的单词、子词遮盖语言模型并不适用于文本生成场景中,特别是生成式文本摘要场景。其原

Read More

带你了解cann的目标检测与识别一站式方案_华为云开发者社区的博客-多极客编程

摘要: 了解通用目标检测与识别一站式方案的功能与特性,还有实现流程,以及可定制点。本文分享自华为云社区《​​玩转CANN目标检测与识别一站式方案​​》,作者: Tianyi_Li。背景介绍目标检测与识别是计算机视觉领域中的关键技术,随着深度学习技术的发展,目标检测与识别的应用场景也越来越广泛。当前, 主要有以下几个应用场景:安全领域:指纹识别、物体识别等。交通领域:车牌号识别、无人驾驶、交通标志识

Read More

一文了解循环神经网络_华为云开发者社区的博客-多极客编程

摘要:循环神经网络(RNN)可是在语音识别、自然语言处理等其他领域中引起了变革!本文分享自华为云社区《​​【MindSpore易点通】深度学习系列-循环神经网络上篇​​》,作者:Skytier循环神经网络(RNN)可是在语音识别、自然语言处理等其他领域中引起了变革!1 应用场景循环神经网络(RNN)其实就是序列模型,我们先来看看其应用场景。在语音识别时,给定了一个输入音频片段X ,并要求输出对应的

Read More

带你体验给黑白照片上色_华为云开发者社区的博客-多极客编程

摘要:借助人工智能技术,可以一定程度上帮助老照片还原原来色彩。还记得之前火热的“老北京视频上色”吗?就是采用类似的技术。本文分享自华为云社区《​​基于MindX SDK在Ascend 310上的黑白图像上色初体验随笔​​》,作者:Tianyi_Li 。前言在智能手机越来越普及的今天,拍摄一张色彩鲜艳、清晰的照片轻而易举。但是老照片没有如此“幸运”,大多为黑白。借助人工智能技术,可以一定程度上帮助老

Read More

python系列教程196——参数匹配_床长人工智能的博客-多极客编程

声明:在人工智能技术教学期间,不少学生向我提一些python相关的问题,所以为了让同学们掌握更多扩展知识更好地理解AI技术,我让助理负责分享这套python系列教程,希望能帮到大家!由于这套python教程不是由我所写,所以不如我的AI技术教学风趣幽默,学起来比较枯燥;但它的知识点还是讲到位的了,也值得阅读! 在调用函数时,如果你没有使用过任何特殊的匹配语法,Python默认会通过位置从左至右匹配

Read More

带你掌握如何使用cann 算子st测试工具msopst_华为云开发者社区的博客-多极客编程

摘要:本期带您了解如何使用msopst工具。本文分享自华为云社区《​​【CANN文档速递13期】算子ST测试工具【msopst】​​》,作者: 昇腾CANN 。如何获取msopst工具msopst工具存储在Ascend-cann-toolkit安装目录的“toolkit/python/site-packages/bin”路径下。支持对TBE算子以及AI CPU算子进行ST测试。CANN软件安装完成

Read More

基于高效采样算法的时序图神经网络系统 (二)_baihai_idp的博客-多极客编程

​​上一期文章​中讲述了在时序图神经网络中的高效图采样算法,本期文章将重点讲述如何进行高效的时序图神经网络的训练。现有的图数据规模极大,导致时序图神经网络的训练需要格外长的时间,因此使用多GPU进行训练变得成为尤为重要,如何有效地将多GPU用于时序图神经网络训练成为一个非常重要的研究议题。本文提供了两种方式来提高多GPU训练的性能,包括局部性感知的数据划分策略以及高效的任务调度策略。首先,本文使用

Read More

基于 pytorch 和神经网络给 girlfriend 制作漫画风头像_华为云开发者社区的博客-多极客编程

摘要:本文中我们介绍的 AnimeGAN 就是 GitHub 上一款爆火的二次元漫画风格迁移工具,可以实现快速的动画风格迁移。本文分享自华为云社区《​​AnimeGANv2 照片动漫化:如何基于 PyTorch 和神经网络给 GirlFriend 制作漫画风头像?【秋招特训】​​》,作者:白鹿第一帅 。前言将现实世界场景的照片转换为动漫风格图像的方法,这是计算机视觉和艺术风格转换中一项有意义且具有

Read More

一起学习ml和dl中常用的几种loss函数_华为云开发者社区的博客-多极客编程

摘要:本篇内容和大家一起学习下机器学习和深度学习中常用到的几种loss函数。本文分享自华为云社区《​​【MindSpore易点通】网络实战之交叉熵类Loss函数​​》,作者:Skytier 。本篇内容和大家一起学习下机器学习和深度学习中常用到的几种loss函数,根据计算分类方式以及场景的不同,我分为了以下三部分进行分析。CrossEntropy Loss交叉熵函数是在分类模型中常用的一种损失函数,

Read More