Search
תמונה של איתי זרם

לייעוץ והכוונה חייגו עכשיו
0526111107

בניית סוכן AI חכם עם RAG או CAG

RAG או CAG: איזו גישה הכי מתאימה לסוכני AI שלך?

תמונה של איתי זרם

נעים להכיר, אני איתי זרם.

מומחה דיגיטל ואוטומציה עם מעל 9 שנות ניסיון. אני חי ונושם את עולם הדיגיטל ואוהב להפוך רעיונות גדולים לפתרונות טכנולוגיים שמניעים תוצאות.
אחרי שנים של עבודה עם עשרות עסקים, אני מביא ניסיון מהשטח וגישה שמחברת בין יצירתיות ליעילות טכנולוגית.
מטרתי היא לעזור לעסקים לנצל את הכלים הדיגיטליים בצורה חכמה ופשוטה, ולשדרג את הדרך בה הם פועלים.

צרו קשר ואני אחזור אליכם אישית!

בשנתיים האחרונות, עולם מודלי השפה הגדולים (LLMs) עבר מהפכה מטורפת. בכל יום כמעט אנחנו שומעים על חידושים משמעותיים שמשנים את העולם כמו שהכרנו אותו ונראה כאילו אי אפשר לעמוד בקצב הזה. פעם אחת מדברים על סוכני AI, אחר מדברים על MCP ויש בכל יום עוד המון מילים גדולות כאלו.

אבל, בכל העולם הזה יש כמה מושגים שכדאי מאוד להכיר כדי שנוכל להבין באמת איך להתמודד עם החידושים האלו ולא להיבהל מהם. אז בואו קודם כל נדבר על מגבלה חשובה עם LLMs – למרות היכולות המרשימות של מודלים כמו GPT, קלוד ודומיו, הם מגיעים עם מגבלה משמעותית – הם יודעים רק את מה שלמדו בתקופת האימון שלהם, זאת אומרת שאם תנסו לבקש מהם מידע ספציפי שהמודל לא אומן עליו – יהיה לו מאוד קשה להחזיר תשובה נכונה ומדויקת.

אז מה עושים כשרוצים שמודל ישתמש במידע פרטי או עדכני שלא היה בסט האימון שלו? לשם כך פיתחו את הטכניקות להעשרת הידע של מודלים, וכאן נכנסות לתמונה שתי גישות מרכזיות: RAG (Retrieval Augmented Generation) ו-CAG (Cache Augmented Generation). בואו נבין מהן הגישות האלה, מתי כדאי להשתמש בכל אחת, ואיך הן משתלבות בעולם האוטומציה עם כלים כמו Make.com ואיך בעזרתן אפשר לבנות סוכני AI חכמים יותר.

מה זה RAG?

RAG (Retrieval Augmented Generation) היא שיטה בה אנחנו:

  1. לוקחים את המידע שלנו ומאחסנים אותו במאגר נתונים מיוחד (בדרך כלל וקטור דאטהבייס)
  2. כשמגיעה שאלה מהמודל, מתבצע בעצם חיפוש של אותו החלק הרלוונטי ביותר מתוך הדאטהבייס שלנו.
  3. מכניסים את החומר הרלוונטי לחלון ההקשר (Context Window) של המודל יחד עם השאלה
  4. המודל מייצר תשובה בהתבסס על המידע הספציפי שהכנסנו

זה תהליך דו-שלבי:

  • שלב מקדים: פירוק המסמכים לחלקים קטנים, יצירת ווקטורים (embeddings) עבור כל חלק ושמירתם במסד נתונים. בעצם מצריך מאיתנו רק להעלות את כל הדאטה אל הVector Database שלנו.
  • שלב המענה: חיפוש במסד הנתונים לפי רלוונטיות לשאלה, שליפת החלקים המתאימים, והעברתם למודל יחד עם השאלה – זאת הפעולה שהמודל AI עצמו יבצע.
איך יודעים במה לבחור? RAG או CAG?

מה זה CAG?

CAG (Cache Augmented Generation) היא שיטה מעט שונה :

  1. קודם כל – טוענים את כל המידע הרלוונטי לחלון ההקשר של המודל בבת אחת.
  2. המודל מעבד את כל המידע בפעם אחת ושומר את המצב הפנימי שלו במטמון (cache) מיוחד שנקרא KV cache.
  3. כשמגיעה שאלה, המודל יכול להשתמש במידע שכבר עיבד בלי לעבד אותו שוב

במקום לחפש בכל פעם את החלקים הרלוונטיים, אנחנו פשוט מזינים למודל את כל המידע מראש וסומכים עליו שישתמש במה שצריך.

ההבדלים המרכזיים בין הגישות

נושאRAGCAG
טיפול במידעמחפש ומאחזר חלקים רלוונטיים בזמן אמתטוען את כל המידע מראש
יכולת הרחבהיכול לעבוד עם מאגרי מידע ענקייםמוגבל לגודל חלון ההקשר של המודל
דיוקתלוי באיכות מנגנון החיפושתלוי ביכולת המודל למצוא מידע רלוונטי בתוך כל המידע שטענו
זמן תגובהאיטי יותר בגלל השלב הנוסף של חיפושמהיר יותר לאחר הטעינה הראשונית
עדכניות המידעקל לעדכן את מסד הנתוניםדורש טעינה מחדש של המידע

מתי נרצה להשתמש בCAG ומתי נרצה להשתמש בRAG?

RAG מתאים במיוחד כאשר:

  • יש לנו מאגר מידע גדול מאוד (אלפי מסמכים או יותר)
  • המידע מתעדכן באופן תדיר ויש בו הרבה שינויים.
  • אנחנו צריכים לדעת מאיזה מקור בדיוק הגיע המידע (ציטוטים מדויקים)
  • אנחנו עובדים עם מודל שיש לו חלון הקשר מוגבל (Context Window)

CAG מתאים במיוחד כאשר:

  • מאגר המידע קטן יחסית ויכול להיכנס לחלון ההקשר של המודל
  • המידע לא משתנה לעתים קרובות
  • זמן התגובה המהיר הוא קריטי
  • עובדים עם מודל שיש לו חלון הקשר גדול
שילוב אוטומציה עם סוכן AI

שילוב RAG ו-CAG עם אוטומציות ב-Make.com

אז אחרי שהבנו מה זה כל דבר ומתי כדאי לנו להשתמש בכל אחד מהם – בואו נדבר על איך הגישות האלה משתלבות בתהליכי אוטומציה שיווקית ואיך השילוב ביניהן יאפשר לנו לבנות סוכני AI חכמים. אם אתם מריצים אוטומציות עם Make.com או פלטפורמות דומות, הנה כמה דרכים מעשיות לשלב את הגישות האלה:

אוטומציות עם RAG:

  1. מערכת תמיכה אוטומטית לעסק:
    • הגדת מודול ב-Make.com שמחבר בין פניות לקוחות לבין מערכת RAG
    • כאשר מגיעה פניית לקוח, Make.com מעביר את השאלה למערכת RAG
    • המערכת מחפשת במסמכי התמיכה, במדריכים או בתיעוד הטכני
    • התשובה המבוססת על המסמכים שהעלתם נשלחת חזרה ללקוח
  2. עוזר מכירות וירטואלי:
    • הגדרת אוטומציה שמעבירה שאלות של לקוחות פוטנציאליים למערכת RAG
    • המערכת מחפשת במפרטי המוצרים, חומרי שיווק וטופסי FAQ
    • הלקוח מקבל תשובה מדויקת המבוססת על המידע העדכני ביותר מהמאגר שהעלתם
  3. אוטומציה של עיבוד מסמכים:
    • בניית סנריו ב- Make.com שיקרא מסמכים חדשים (חוזים, הסכמים, מידע טכני)
    • העברת אותם המסמכים למערכת RAG שתעדכן את המאגר באופן אוטומטי
    • כך כל המערכות תמיד משתמשות במידע העדכני ביותר!

אוטומציות עם CAG:

  1. צ'אטבוט וואטסאפ לשירות לקוחות:
    • טוענים למודל מראש את המידע הנדרש על מוצרים, שירותים ונהלים
    • הגדר ב-Make.com חיבור בין וואטסאפ למודל ה-CAG
    • כשלקוח פונה, המודל כבר מחזיק את כל המידע ויכול לענות מיד ללא צורך בחיפוש
  2. אסיסטנט אישי פנים-ארגוני:
    • טען למודל את נהלי החברה, לוח הזמנים, ומידע ארגוני נפוץ
    • חבר אותו למערכת הודעות פנימית דרך Make.com
    • עובדים יכולים לשאול שאלות ולקבל תשובות מיידיות מבוססות על המידע הפנימי
  3. מערכת FAQ חכמה:
    • טען למודל מראש את כל השאלות והתשובות הנפוצות
    • חבר אותו לאתר או לבוט צ'אט דרך Make.com
    • המבקרים מקבלים מענה מהיר בזמן אמת

דוגמה מעשית: בניית תהליך אוטומציה משולב בעזרת Make.com

בואו נראה איך בונים אוטומציה משולבת שיכולה להשתמש גם ב-RAG וגם ב-CAG, בהתאם לסוג השאלה:

  1. הגדרת הטריגר: נגדיר טופס פנייה באתר או הודעת וואטסאפ נכנסת כטריגר ב-Make.com
  2. ניתוב חכם: נשתמש במודול של OpenAI כדי לסווג את השאלה:
    • אם זו שאלה פשוטה שכנראה מכוסה במידע הבסיסי – נשתמש ב-CAG
    • אם זו שאלה מורכבת שדורשת חיפוש מתקדם – נשתמש ב-RAG
  3. מסלול ה-CAG: אם השאלה פשוטה, נעביר אותה ישירות למודל שכבר טעון עם המידע הבסיסי
  4. מסלול ה-RAG: אם השאלה מורכבת, נשלח אותה למנוע חיפוש שיאתר את החלקים הרלוונטיים במאגר המידע המורחב, ואז נעביר את התוצאות והשאלה למודל
  5. משלוח התשובה: לבסוף, Make.com ישלח את התשובה חזרה ללקוח דרך הערוץ המתאים

נקודות חשובות ליישום מעשי

  1. שקול את השיקולים העסקיים שלך: האם מהירות תגובה היא קריטית? האם יש לך מאגר ידע עצום? האם המידע מתעדכן לעתים קרובות?
  2. קח בחשבון את העלויות: RAG דורש תחזוקה של מסד נתונים וקטורי, בעוד ש-CAG דורש מודל עם חלון הקשר גדול יותר, שלרוב יקר יותר להפעלה.
  3. שילוב הוא אופציה חזקה: במקרים רבים, שילוב של שתי הגישות יכול לתת את התוצאות הטובות ביותר – CAG למידע בסיסי וקבוע, ו-RAG למידע מורחב ומתעדכן.
  4. עקוב אחרי הביצועים: הגדר מדדים לדיוק ולמהירות התגובה, ובדוק איזו גישה נותנת את התוצאות הטובות ביותר לשימוש הספציפי שלך.
בניית סוכני AI חכמים

איך RAG ו-CAG קשורים לבניית סוכני AI חכמים יותר?

בעידן העכשווי, סוכני AI הם הדור הבא של אוטומציה חכמה. אלה הם מערכות אוטונומיות שלא רק מגיבות לבקשות אלא גם יוזמות פעולות, מקבלות החלטות, ומבצעות רצף של משימות להשגת מטרה. כשמדובר בסוכני AI, הבחירה בין RAG ו-CAG היא קריטית עוד יותר. סוכנים הפועלים בסביבות עשירות במידע (כמו עוזר מחקר משפטי) יכולים להפיק תועלת רבה יותר מ-RAG בגלל היכולת לחפש באופן דינמי במאגרי מידע עצומים. לעומת זאת, סוכנים המבצעים משימות חוזרות עם מערך ידע מוגדר (כמו עוזר אישי וירטואלי) עשויים לפעול ביעילות רבה יותר עם CAG. הגמישות של Make.com מאפשרת ליצור סוכני AI היברידיים שיכולים לנווט בין שתי הגישות בהתאם למשימה, מה שהופך אותם לחכמים ומסתגלים יותר מכל פתרון אוטומציה מסורתי.

סיכום

RAG ו-CAG הן גישות משלימות להעשרת מודלי שפה עם מידע חיצוני. בעולם האוטומציה, הבחירה בין השתיים תלויה בצרכים הספציפיים שלך, בגודל מאגר המידע, בתדירות העדכונים ובחשיבות של זמן התגובה.

כלים כמו Make.com מאפשרים לך לבנות תהליכי אוטומציה חכמים שמשלבים את הגישות האלה עם מערכות העסקיות שלך – מה שמאפשר לך להעניק שירות טוב יותר, לחסוך זמן יקר, ולהפוך את המידע העסקי שלך לנכס אסטרטגי שמייצר ערך אמיתי.

אולי זה יכול לעניין מישהו נוסף? אשמח לשיתוף :)

שירותים נוספים שאולי יעניינו אותך: