Wir freuen uns, die Unterstützung von pgvector 0.7.0 bekannt zu geben, einer leistungsfähigen Erweiterung für PostgreSQL, die effiziente und skalierbare Vektorsuchfunktionen ermöglicht. Diese Veröffentlichung markiert einen bedeutenden Meilenstein in der Entwicklung von pgvector, das unter Entwicklern und Datenwissenschaftlern gleichermaßen an Beliebtheit gewinnt. Hier sind einige Einblicke in die Version pgvector 0.7.0:
Pgvector 0.7.0 ist ab sofort in allen RDS PostgreSQL verfügbar
Pgvector 0.7.0 führt zwei neue Vektortypen ein: halfvec und sparsevec. Halfvec ermöglicht das Indexieren von bis zu 4.000 Dimensionen mit 2-Byte-Floats, während sparsevec das Indexieren von bis zu 1.000 Nicht-Null-Dimensionen ermöglicht. Darüber hinaus enthält die Veröffentlichung Indexierungsunterstützung für binäre Vektoren mit dem Bit-Typ, der bis zu 64.000 Dimensionen handhaben kann.
Die neue Version bietet auch Unterstützung für die Quantisierung von Vektoren mittels Ausdrucksindizes. Diese Funktion ermöglicht es Benutzern, Vektoren von 4-Byte- zu 2-Byte-Floats und sogar binäre Quantisierung mittels der Funktion binary_quantize umzusetzen. Diese Verbesserung ermöglicht effizientere Speicherung und Abfrage von Vektoren.
Pgvector 0.7.0 führt zwei neue Distanzfunktionen ein, die speziell für Bit-Vektoren entworfen wurden: hamming_distance und jaccard_distance. Die Veröffentlichung enthält auch Unterstützung für HNSW-Indexierung (Hierarchical Navigable Small World) für L1-Distanzoperationen, was die Leistung von Vektorsuchfunktionen weiter verbessert.
Um die Leistung weiter zu optimieren, enthält pgvector 0.7.0 zusätzliche Unterstützung für SIMD (Single Instruction, Multiple Data) und CPU-Auslösung für Linux x86-64 Architekturen. Diese Funktion ermöglicht der Erweiterung, die CPU-Fähigkeiten auszunutzen, was zu schnelleren Ausführungszeiten für Abfragen führt.
Weitere Informationen zur Installation von RDS PostgreSQL pgvector finden Sie im Help Center.