הערה

אילו query transformation techniques באמת עוזרים ל-RAG?

Query rewrite, decomposition, step-back prompting, HyDE, fusion — ומתי כל אחד מהם שווה את ה-latency הנוסף.

24 בפברואר 20263 דק׳ קריאהמאת Alex Chernysh

RAGRetrievalPromptingArchitecture

לקפוץ לחלק

Query transformation מועיל כשהוא פותר כשל retrieval מסוים. הוא הופך לתיאטרון יקר ברגע שמוסיפים אותו רק כי דיאגרמת הארכיטקטורה הרגישה בודדה.

1. לא כל שאלת retrieval צריכה rewrite

יש כמה מחלקות כשל שונות:

אם לא ברור איזו מחלקת כשל קיימת, כל transformation layer תיראה אותו דבר: עוד latency, יותר תנועה, ולאו דווקא יותר evidence.

Rewrite עוזר כשהפער הוא מילוני:

זה שימושי. זאת גם השכבה שהכי קל להעמיס יתר על המידה.

אם rewrite רץ על כל שאלה בלי אבחנה, הוא הופך מהר למס נוסף על המערכת.

Decomposition מתאים כשיש בשאלה כמה תתי-שאלות שונות, שכל אחת מהן צריכה retrieval נפרד.

זה טוב במיוחד כאשר:

הבעיה: decomposition מוסיף עוד retrieval passes. אם ה-corpus quality עדיין חלשה, מקבלים יותר תוצאות חלשות, לא יותר ודאות.

Step-back עוזר כשצריך למסגר את השאלה מחדש ברמה מושגית יותר לפני שמחפשים.

זה מתאים למצבים שבהם:

גם כאן, אם ה-document structure חלש, השלב הנוסף רק מכסה על הבעיה לזמן קצר.

HyDE יכול להיות שימושי כשמרחב החיפוש עצמו דל או sparse, וצריך לייצר היפותזה טקסטואלית טובה יותר לצורך retrieval.

הוא פחות מתאים כש:

במילים אחרות: HyDE הוא כלי. לא ברירת מחדל.

Fusion עוזר כשיש כמה ניסוחים סבירים של אותה שאלה, וכל אחד מהם פותח מסמכים אחרים.

זה עובד טוב כש:

זה עובד פחות טוב כשאין דרך ברורה למזג את התוצאות, או כשהקורפוס קטן מספיק ששכבה כזאת רק מסרבלת את המערכת.

ההחלטה הפרקטית שלי בדרך כלל נראית כך:

אבל לפני כל זה אני שואל:

אם התשובות האלו בעייתיות, transformation הוא לא המקום הראשון להתחיל בו.

Query transformation הוא לא מנוע עומק כללי. הוא טיפול נקודתי בסימפטום retrieval ספציפי.

כשהוא נבחר נכון, הוא מורגש. כשהוא נבחר סתם כך, הוא בעיקר מוסיף latency ומקשה להבין מה המערכת באמת הייתה צריכה.