前几天我已经写了一篇文章来介紹如何有效的拿到标的方法文章标题是《爆款必备,100%获得新品标的思路和方法》
那么最近呢 依然有很多同学问我说我已经拿到新品标叻,但是过几天就没有了其实这里面还有更多深层的原因的,今天我就把这个是如何识别相似图片识别位置的原理给大家讲一下,如果您看明白了自己就可以得出拿到新品标的方法,或者说是如何通过对图片识别位置的处理避免掉被合并同款。
这两个点如果在新品上架后能够做到的话,将对你的宝贝权重的提升有非常大的帮助
在讲淘宝是如何识别相似图片识别位置的原理前,我们先来看下 图片識别位置搜索的功能不知道大家是否已经知道这个功能了,目前有个网站叫 淘淘搜 这个网站
我把要搜索的图片识别位置上传好然后选擇搜索上衣,
马上这个搜索就帮我把相同的宝贝找到了
对于淘宝现在你去搜索,也都会看到搜索结果中会有“找同款”和“找相似”嘚功能,如图:
那么他们实现的原理是什么呢?
首先大家要明白搜索引擎有个算法叫做“信息指纹算法”,这个算法的作用就是对每張图片识别位置生成一个"信息指纹"(fingerprint)字符串然后比较不同图片识别位置的指纹,结果越接近就说明图片识别位置越相似。
图像比较嘚原理 (参考资料)
最简单来讲如何比较两张图像是否相似就是重叠比较。所谓重叠比较就是将两张图片识别位置叠加起来然后看他們有多少是相似的。重叠在实现上最简单的做法是逐像素进行比较之后我们就可以知道这两张图到底有多少是不一样的。逐点比较需要計算图像中的每个点那么就可以通过首先将图像划分成很多小的单元格然后比较两个图像子单元格差别是否大就可以知道图像差异是否夶了。但是逐点比较是基于两张图像在位置上必须是对齐的而其一旦在位置或者形状大小上有差异,逐点比较必然会失败
以此来看如哬实现两张图像的比较我们必须找到图像中有共性的部分,它们共性就是我们所说的特征特征是一些能反应图像特点的量,如果这些量對上了我们便可以猜测图像可能是相似的。一些图像当中常用的特征是图像有颜色信息比如都是红色图像才有可能相似;如果一个红┅个绿图像肯定相差十万八千里了。此外图像当中可以利用的特征还有材质纹理信息特征点信息。比如两张图像都有类似布料图案的信息(如豹纹)那么我们便能够把他们找出来所谓的特征点信息是图像当中有代表性比较特殊的点,这些点在尺度上和局部分布信息上都囿其特别性如果两张图像有相似的显着特征点,并且相似的局部点数量非常之大那么便可以推断图像是相类似的。
根据以上参考资料峩们可以得出搜索引擎在进行相似图片识别位置比较的时候重点要比较如下信息:
1丶图片识别位置的颜色信息
结合淘宝的搜索引擎的话,我们的宝贝要拿到新品标同时要避免合并同款,有可能比较的信息更多一些我们一起列举一下:
1丶图片识别位置的exfi信息
那么我们知噵这些点后我们应该怎么实际操作呢,比如:
1丶删除图片识别位置的exfi信息 (用光影魔术手)
2丶重新上传图片识别位置生成新的图片识别位置URL路径
4丶对图片识别位置的纹理进行修改
5丶对于图片识别位置的结构可以采用先抠图,然后对宝贝的进行翻转等操作或者改变角度等
6丶宝贝信息方面根据情况做一定的修改
7丶对详情页图片识别位置,进行重新切图以及打乱原有详情页图片识别位置排列顺序等
8丶改变图爿识别位置格式,将JPG保存为PNG
聊一聊双十一背后的技术 毫秒分詞算啥, 试试正则和相似度
图像处理的业务场景比较多例如 图像搜索、视频去重、人脸识别、美图、图片识别位置去重 等。
比如视频去偅,一些用户上传了较多的视频同一部电影可能有不同的版本,分辨率不一样音轨不一样,压缩比不一样这种情况会导致服务端重複存储大量的视频。
又比如甄别黄色视频或黄色图片识别位置鉴黄师的职业要消失了。
有什么方法可以得到重复的视频呢 如何鉴别黄銫视频和图片识别位置呢? 本文将给你揭晓
另一方面,图片识别位置搜索是继文字搜索后又一个比较常用的搜索引擎市面上常见的搜索引擎有谷歌、百度、搜狗等图片识别位置搜索引擎。 ,
例如在搜索引擎提供的接口中上层了一张雪人的图片识别位置,搜出来一堆和雪囚近似的图片识别位置
图片识别位置搜索是怎么做到的呢?
万能的PostgreSQL绝不落下这么好玩的东东,通过PG万能的API可以扩展它的图片识别位置搜索功能。
如果你对PostgreSQL扩展开发感兴趣可以参考我写的文章 《》。
PostgreSQL的图像搜索插件使用了非常主流的Haar wavelet技术对图像进行变换后存储可以参考WIKI囷一篇关于HW的文献。
imgsmlr新增了两个数据类型
新增了几个函数, 将图像的二进制转换为pattern类型将pattern中存储的数据转换为signature类型
导入一些图片识别位置,例如(越多越好)
近似度查询例如查询与id = :id的图像相似的图像,按相似度排行取出前10条
这里可以用到KNN索引,快速按相似度排行输出结果
视频去重,可以抽取视频中的关键帧自关联产生笛卡尔积,计算不同视频的任意两张图片识别位置的相似度相似度达到一定阈值,可以认为是相同视频
创建图片识别位置表,并将所有视频的关键帧导入表中
导入图片识别位置假设为jpeg格式
1. PostgreSQL是一个非常强大的数据库,功能高度可定制而且不需要动到PostgreSQL的内核。 安全可靠
2. 使用图像搜索的技术就是PostgreSQL功能扩展的例子,速度杠杠的还记得我以前给出的关於地理位置近邻查询的性能指标吗。 《》
3. 如果你对PostgreSQL扩展开发感兴趣,可以参考我写的文章 《》