局部?jī)?yōu)化乘積量化 一句話(huà)概括本篇文章战惊,在IVF(或者任何粗量化器)的每個(gè)cell內(nèi)單獨(dú)對(duì)殘差訓(xùn)練一個(gè)fine-quantizer信柿。之前普遍的方法是對(duì)殘差也全局來(lái)訓(xùn)钠绍。LOPQ是...
局部?jī)?yōu)化乘積量化 一句話(huà)概括本篇文章战惊,在IVF(或者任何粗量化器)的每個(gè)cell內(nèi)單獨(dú)對(duì)殘差訓(xùn)練一個(gè)fine-quantizer信柿。之前普遍的方法是對(duì)殘差也全局來(lái)訓(xùn)钠绍。LOPQ是...
十億級(jí)深度學(xué)習(xí)向量數(shù)據(jù)集的高效索引 作者來(lái)自俄羅斯Yandex 編者的總結(jié) 核心思路是使用VQ而非PQ避免分段產(chǎn)生各分段之間的互信息損失舆声。 技術(shù)手段是使用VQ中的RVQ做兩層...
HCNNG (Hierarchical Clustering-Based Nearest Neighbor Graph)是近些年在多個(gè)benchmark中評(píng)測(cè)位列前茅的圖索引...
如題,又是一個(gè)血淚教訓(xùn)柳爽。媳握。。 二維vector磷脯,比如vector<vector >a蛾找,如果要寫(xiě)入文件,或者讀取赵誓,切忌不可fwrite(&a[0][0], sizeof(int...
說(shuō)明:本人8月5日成功申請(qǐng)到“2020年國(guó)家建設(shè)高水平大學(xué)公派研究生項(xiàng)目”聯(lián)合培養(yǎng)博士打毛,由于疫情影響網(wǎng)申時(shí)間順延為5月15日至6月10日柿赊,本文記錄了我的CSC申請(qǐng)全過(guò)程。 申...
Steiner Tree是一個(gè)經(jīng)典的NP-hard問(wèn)題幻枉,問(wèn)題定義不在這里重復(fù)了闹瞧,主要介紹幾種近年來(lái)典型的解法思路。Steiner Forest擴(kuò)展了Tree的定義展辞,設(shè)置一組起...
本文作者來(lái)自丹麥和意大利,曾設(shè)計(jì)ann-benchmarks獲得ANN領(lǐng)域廣泛關(guān)注万牺。 編者的思考 只選了數(shù)據(jù)集中的點(diǎn)當(dāng)做query罗珍,可能會(huì)有bias。 LID, expans...
2019BIGVIS-Progressive Similarity Search on Time Series Data標(biāo)題:時(shí)間序列similarity-search的一個(gè)...
作者來(lái)自英偉達(dá) 編者:本文只介紹圖結(jié)構(gòu)脚粟,GPU部分暫時(shí)省略覆旱。 編者的總結(jié)(圖結(jié)構(gòu)方面) 是NSSG的一個(gè)改版,用一個(gè)K較大的KNN-Graph做初始化核无,然后在其中通過(guò)兩條繞路...
標(biāo)題:高維數(shù)據(jù)的最近鄰:hub的產(chǎn)生和影響本文還有擴(kuò)展版:Hubs in Space: Popular Nearest Neighbors in High-Dimension...
hubness(exact入度)比較大的點(diǎn)扣唱,最終在nn-descent產(chǎn)生的Kgraph中的召回普遍比較高,hubness比較小的點(diǎn)則說(shuō)不準(zhǔn)团南,有的召回高噪沙,有的召回低。 原因:...
標(biāo)題:大規(guī)模高維數(shù)據(jù)可視化作者來(lái)自MSRA代碼開(kāi)源好用:https://github.com/lferry007/LargeVis[https://github.com/lf...
標(biāo)題:層次化最近鄰圖嵌入以高效降維作者來(lái)自德國(guó)吐根,代碼開(kāi)源好用正歼。https://github.com/koulakis/h-nne[https://github.com/kou...
請(qǐng)教下3.2部分概率模型那里,沒(méi)有看懂是怎么從knnGraph投影過(guò)去的
Visualizing large-scale and high-dimensional dataAbstract: 之前的降維技術(shù)用t-SNE等技術(shù):計(jì)算量大我們:LargeVis拷橘,利用K近鄰算法局义,效率和效力都好,對(duì)不同的數(shù)據(jù)集表現(xiàn)穩(wěn)定冗疮。 Introduction 對(duì)于...
Abstract: 之前的降維技術(shù)用t-SNE等技術(shù):計(jì)算量大我們:LargeVis萄唇,利用K近鄰算法,效率和效力都好术幔,對(duì)不同的數(shù)據(jù)集表現(xiàn)穩(wěn)定另萤。 Introduction 對(duì)于...
標(biāo)題:efanna:基于KNN-Graph的超快ANN算法 基本思路:在KNN-Graph上保留一個(gè)randomize kd-trees,作為KNN-Graph的入口點(diǎn) 搜索...
Marigold: 高效的高維k-means聚類(lèi) ABSTRACT & 1 INTRODUCTION k-means的泛用性不必多說(shuō)诅挑,但在高維空間中仲墨,由于距離計(jì)算的代價(jià)線性...
作者來(lái)自東華、UNSW和天津科技大學(xué)揍障。 Abstract 本文想要回答兩個(gè)問(wèn)題: 為什么基于圖的算法搜索性能這么好目养? 什么樣的數(shù)據(jù)特征會(huì)影響搜索性能,以及如何影響毒嫡? I. I...
標(biāo)題:通過(guò)優(yōu)化的有指導(dǎo)搜索和貪婪算法實(shí)現(xiàn)近鄰圖上的兩階段搜索作者來(lái)自杭電 編者的總結(jié) 本文將圖上的貪婪查詢(xún)分為兩階段癌蚁,第一階段導(dǎo)航重點(diǎn)在效率幻梯,第二階段搜局部近鄰重點(diǎn)在精度。 ...
編者的總結(jié) 本文在billion級(jí)別數(shù)據(jù)集上做的對(duì)比實(shí)驗(yàn)努释,結(jié)果不出意外碘梢,HNSW, Vamnna性能最穩(wěn)定。值得注意的是伐蒂,HCNNG在out-of-distribution數(shù)...