English: Diagram illustrating the two-phase process for document retrieval using dense embeddings.
Indexing Phase:
Documents are transformed into vector representations using dense embeddings.
These vectors are stored in a vector database.
Inference Phase:
The posed question is converted into a query vector using the same embedding technique.
The vector database retrieves the top four most relevant articles by computing the cosine distance between the query vector and stored document vectors.
The content of the selected articles is introduced to the Large Language Model (LLM) as context, together with the original question.
The LLM is then instructed to formulate an answer.
This process ensures efficient and relevant document retrieval based on the semantic content of queries.
Polski: Diagram ilustrujący dwuetapowy proces wyszukiwania dokumentów przy użyciu gęstych osadzeń.
Faza indeksowania:
Dokumenty są przekształcane w reprezentacje wektorowe przy użyciu gęstych osadzeń.
Te wektory są przechowywane w wektorowej bazie danych.
Faza wnioskowania:
Zadane pytanie jest konwertowane na wektor zapytania przy użyciu tej samej techniki osadzania.
Wektorowa baza danych wyszukuje cztery najbardziej odpowiednie artykuły, obliczając odległość kosinusową między wektorem zapytania a przechowywanymi wektorami dokumentów.
Treść wybranych artykułów jest wprowadzana do Dużego Modelu Językowego (LLM) jako kontekst, wraz z oryginalnym pytaniem.
Następnie instruuje się LLM, aby sformułował odpowiedź.
Ten proces gwarantuje efektywne i trafne wyszukiwanie dokumentów na podstawie semantycznej zawartości zapytań.
Українська: Діаграма, яка показує двоетапний процес пошуку документів з використанням щільних вкладень.
Етап індексування:
Документи перетворюють на векторні подання з використанням щільних вкладень.
Ці вектори зберігають у векторній базі даних.
Етап висновування:
Задане питання перетворюють на вектор запиту з використання того же щільного подання.
Векторна база даних знаходить чотири найвідповідніші позиції, обчислюючи косинусну відстань між вектором запиту та векторами збережених документів.
Вміст обраних позицій пропонується Великій Мовній Моделі (ВММ) як контекст, разом із первинним запитанням.
ВММ відтак кажуть сформулювати відповідь.
Цей процес забезпечує ефективний та доречний пошук документів на основі семантичного вмісту запитів.
برای به اشتراک گذاشتن – برای کپی، توزیع و انتقال اثر
تلفیق کردن – برای انطباق اثر
تحت شرایط زیر:
انتساب – شما باید اعتبار مربوطه را به دست آورید، پیوندی به مجوز ارائه دهید و نشان دهید که آیا تغییرات ایجاد شدهاند یا خیر. شما ممکن است این کار را به هر روش منطقی انجام دهید، اما نه به هر شیوهای که پیشنهاد میکند که مجوزدهنده از شما یا استفادهتان حمایت کند.
انتشار مشابه – اگر این اثر را تلفیق یا تبدیل میکنید، یا بر پایه آن اثری دیگر خلق میکنید، میبایست مشارکتهای خود را تحت مجوز یکسان یا مشابه با ا اصل آن توزیع کنید.
این پرونده حاوی اطلاعات اضافهایاست که احتمالاً دوربین دیجیتال یا پویشگری که در ایجاد یا دیجیتالیکردن آن به کار رفته آن را افزوده است. اگر پرونده از وضعیت ابتداییاش تغییر داده شده باشد آنگاه ممکن است شرح و تفصیلات موجود اطلاعات تصویر را تماماً بازتاب ندهد.