前期研究了使用 Elasticsearch term vectors API 的方法,從 ES 中提取文檔的詞頻、文檔頻率等罚拟。其參數(shù)如下 sum_doc_freq:該字段中所...
前期研究了使用 Elasticsearch term vectors API 的方法,從 ES 中提取文檔的詞頻、文檔頻率等罚拟。其參數(shù)如下 sum_doc_freq:該字段中所...
k8s nginx-ingress-controller Failed to upload report413 Request Entity Too Large 上傳大小限制...
實驗環(huán)境的 k8s 先前部署時嘗試使用負載均衡模式部署心肪,不知道為何竟然能夠運行戚宦。 過了很久艺配,最近 ingress 服務(wù)解析出現(xiàn)了問題钢猛,且找不出問題根源伙菜,于是嘗試更換 node...
圖數(shù)據(jù)庫批量錄入大概有以下幾種方法: Cypher 語句(create):適合1-1w節(jié)點的場景,速度很慢 apoc.periodic.iterate 接口 + Cypher...
由于對圖數(shù)據(jù)庫不熟悉命迈,我們在向圖數(shù)據(jù)錄入數(shù)據(jù)時發(fā)現(xiàn)錄入速度不符合要求 我們的錄入思路是: 錄入節(jié)點的同時贩绕,順便構(gòu)建該節(jié)點與其他節(jié)點的邊火的,使用了neo4j apoc語法可以一句...
在熟練掌握 ai 對話的技術(shù)后,儲備了一些技術(shù)方面的知識 1. 余弦相似度 余弦相似度是一種衡量文本相似度的方法淑倾,它用兩個文本向量的夾角的余弦值來表示兩個文本的相似程度12馏鹤。...
1. 問題 1. 使用全文檢索時,文件名未命中(朱發(fā)現(xiàn)) 2. 文件名命中娇哆,但排名靠后(分?jǐn)?shù)太低)(在解決第一個問題后測試時發(fā)現(xiàn)) 2. 問題挖掘 2.1 文件名未命中 文件...
今天突然遇到文件名搜不到的情況湃累,查看了ES DSL語句,發(fā)現(xiàn)文件名使用 query_string 查詢碍讨,而文件名是 keyword 類型字段治力。 經(jīng)過實驗和上網(wǎng)搜索,發(fā)現(xiàn) ke...
讀書筆記 | 《深入理解 Elasticsearch》 當(dāng)一個文檔經(jīng) Lucene 返回勃黍,則意味著該文檔與用戶提交的查詢是匹配的宵统。返回的文檔中,有一個文檔得分覆获,得分越高马澈,說明...
執(zhí)行 Clickhouse 版本 23.1.2.9-1 (2023.2.3最新) 報錯相同的版本還有: 21.1.9.41-2 22.3.3.44 基表agg_table_b...
最近跟大量圖片剛上了涤伐,正好找到了相關(guān)的軟件記錄一下 圖片管理軟件:Picasa 能夠自動從圖片中識別頭像,給頭像命名后荆永,自動按命名建立人物相冊废亭,試了一下国章,識別率挺高的具钥,缺點就...
在存儲方面,k8s 提供“卷”來存儲數(shù)據(jù)液兽,卷的種類很多骂删,我們在部署中使用 NFS (網(wǎng)絡(luò)文件系統(tǒng))卷來作為服務(wù)的網(wǎng)絡(luò)存儲卷 1. Linux 上將目錄設(shè)置為 NFS 共享卷 ...
1. 接口和參數(shù) _reindex 接口 請求參數(shù) 請求參數(shù)位于 POST _reindex? 之后 查詢參數(shù) 查詢參數(shù)位于請求體中 2. 在 reindex 期間修改文檔 ...
1. 給腳本傳參 2. 訪問文檔字段和指定變量[https://www.elastic.co/guide/en/elasticsearch/reference/7.17...
參考:https://www.elastic.co/guide/en/elasticsearch/reference/7.17/modules-node.html#ml-no...
之前在項目中并沒有注意到 MySQL 對宿主機的時間敏感芥被,直到這次某個后端程序報連接錯誤欧宜,核查了網(wǎng)絡(luò)連接、數(shù)據(jù)庫狀態(tài)都沒問題拴魄,最后發(fā)現(xiàn)該程序在連接時設(shè)置了時區(qū)冗茸,因此想到有可能...