נעים להכיר, אני איתי זרם.

מומחה דיגיטל ואוטומציה עם מעל 9 שנות ניסיון. אני חי ונושם את עולם הדיגיטל ואוהב להפוך רעיונות גדולים לפתרונות טכנולוגיים שמניעים תוצאות.
אחרי שנים של עבודה עם עשרות עסקים, אני מביא ניסיון מהשטח וגישה שמחברת בין יצירתיות ליעילות טכנולוגית.
מטרתי היא לעזור לעסקים לנצל את הכלים הדיגיטליים בצורה חכמה ופשוטה, ולשדרג את הדרך בה הם פועלים.

צרו קשר ואני אחזור אליכם אישית!

בשנתיים האחרונות, עולם מודלי השפה הגדולים (LLMs) עבר מהפכה מטורפת. בכל יום כמעט אנחנו שומעים על חידושים משמעותיים שמשנים את העולם כמו שהכרנו אותו ונראה כאילו אי אפשר לעמוד בקצב הזה. פעם אחת מדברים על סוכני AI, אחר מדברים על MCP ויש בכל יום עוד המון מילים גדולות כאלו.

אבל, בכל העולם הזה יש כמה מושגים שכדאי מאוד להכיר כדי שנוכל להבין באמת איך להתמודד עם החידושים האלו ולא להיבהל מהם. אז בואו קודם כל נדבר על מגבלה חשובה עם LLMs – למרות היכולות המרשימות של מודלים כמו GPT, קלוד ודומיו, הם מגיעים עם מגבלה משמעותית – הם יודעים רק את מה שלמדו בתקופת האימון שלהם, זאת אומרת שאם תנסו לבקש מהם מידע ספציפי שהמודל לא אומן עליו – יהיה לו מאוד קשה להחזיר תשובה נכונה ומדויקת.

אז מה עושים כשרוצים שמודל ישתמש במידע פרטי או עדכני שלא היה בסט האימון שלו? לשם כך פיתחו את הטכניקות להעשרת הידע של מודלים, וכאן נכנסות לתמונה שתי גישות מרכזיות: RAG (Retrieval Augmented Generation) ו-CAG (Cache Augmented Generation). בואו נבין מהן הגישות האלה, מתי כדאי להשתמש בכל אחת, ואיך הן משתלבות בעולם האוטומציה עם כלים כמו Make.com ואיך בעזרתן אפשר לבנות סוכני AI חכמים יותר.

מה זה RAG?

RAG (Retrieval Augmented Generation) היא שיטה בה אנחנו:

לוקחים את המידע שלנו ומאחסנים אותו במאגר נתונים מיוחד (בדרך כלל וקטור דאטהבייס)
כשמגיעה שאלה מהמודל, מתבצע בעצם חיפוש של אותו החלק הרלוונטי ביותר מתוך הדאטהבייס שלנו.
מכניסים את החומר הרלוונטי לחלון ההקשר (Context Window) של המודל יחד עם השאלה
המודל מייצר תשובה בהתבסס על המידע הספציפי שהכנסנו

זה תהליך דו-שלבי:

שלב מקדים: פירוק המסמכים לחלקים קטנים, יצירת ווקטורים (embeddings) עבור כל חלק ושמירתם במסד נתונים. בעצם מצריך מאיתנו רק להעלות את כל הדאטה אל הVector Database שלנו.
שלב המענה: חיפוש במסד הנתונים לפי רלוונטיות לשאלה, שליפת החלקים המתאימים, והעברתם למודל יחד עם השאלה – זאת הפעולה שהמודל AI עצמו יבצע.

מה זה CAG?

CAG (Cache Augmented Generation) היא שיטה מעט שונה :

קודם כל – טוענים את כל המידע הרלוונטי לחלון ההקשר של המודל בבת אחת.
המודל מעבד את כל המידע בפעם אחת ושומר את המצב הפנימי שלו במטמון (cache) מיוחד שנקרא KV cache.
כשמגיעה שאלה, המודל יכול להשתמש במידע שכבר עיבד בלי לעבד אותו שוב

במקום לחפש בכל פעם את החלקים הרלוונטיים, אנחנו פשוט מזינים למודל את כל המידע מראש וסומכים עליו שישתמש במה שצריך.

ההבדלים המרכזיים בין הגישות

נושא	RAG	CAG
טיפול במידע	מחפש ומאחזר חלקים רלוונטיים בזמן אמת	טוען את כל המידע מראש
יכולת הרחבה	יכול לעבוד עם מאגרי מידע ענקיים	מוגבל לגודל חלון ההקשר של המודל
דיוק	תלוי באיכות מנגנון החיפוש	תלוי ביכולת המודל למצוא מידע רלוונטי בתוך כל המידע שטענו
זמן תגובה	איטי יותר בגלל השלב הנוסף של חיפוש	מהיר יותר לאחר הטעינה הראשונית
עדכניות המידע	קל לעדכן את מסד הנתונים	דורש טעינה מחדש של המידע

מתי נרצה להשתמש בCAG ומתי נרצה להשתמש בRAG?

RAG מתאים במיוחד כאשר:

יש לנו מאגר מידע גדול מאוד (אלפי מסמכים או יותר)
המידע מתעדכן באופן תדיר ויש בו הרבה שינויים.
אנחנו צריכים לדעת מאיזה מקור בדיוק הגיע המידע (ציטוטים מדויקים)
אנחנו עובדים עם מודל שיש לו חלון הקשר מוגבל (Context Window)

CAG מתאים במיוחד כאשר:

מאגר המידע קטן יחסית ויכול להיכנס לחלון ההקשר של המודל
המידע לא משתנה לעתים קרובות
זמן התגובה המהיר הוא קריטי
עובדים עם מודל שיש לו חלון הקשר גדול

שילוב RAG ו-CAG עם אוטומציות ב-Make.com

אז אחרי שהבנו מה זה כל דבר ומתי כדאי לנו להשתמש בכל אחד מהם – בואו נדבר על איך הגישות האלה משתלבות בתהליכי אוטומציה שיווקית ואיך השילוב ביניהן יאפשר לנו לבנות סוכני AI חכמים. אם אתם מריצים אוטומציות עם Make.com או פלטפורמות דומות, הנה כמה דרכים מעשיות לשלב את הגישות האלה:

אוטומציות עם RAG:

מערכת תמיכה אוטומטית לעסק:
- הגדת מודול ב-Make.com שמחבר בין פניות לקוחות לבין מערכת RAG
- כאשר מגיעה פניית לקוח, Make.com מעביר את השאלה למערכת RAG
- המערכת מחפשת במסמכי התמיכה, במדריכים או בתיעוד הטכני
- התשובה המבוססת על המסמכים שהעלתם נשלחת חזרה ללקוח
עוזר מכירות וירטואלי:
- הגדרת אוטומציה שמעבירה שאלות של לקוחות פוטנציאליים למערכת RAG
- המערכת מחפשת במפרטי המוצרים, חומרי שיווק וטופסי FAQ
- הלקוח מקבל תשובה מדויקת המבוססת על המידע העדכני ביותר מהמאגר שהעלתם
אוטומציה של עיבוד מסמכים:
- בניית סנריו ב- Make.com שיקרא מסמכים חדשים (חוזים, הסכמים, מידע טכני)
- העברת אותם המסמכים למערכת RAG שתעדכן את המאגר באופן אוטומטי
- כך כל המערכות תמיד משתמשות במידע העדכני ביותר!

אוטומציות עם CAG:

צ'אטבוט וואטסאפ לשירות לקוחות:
- טוענים למודל מראש את המידע הנדרש על מוצרים, שירותים ונהלים
- הגדר ב-Make.com חיבור בין וואטסאפ למודל ה-CAG
- כשלקוח פונה, המודל כבר מחזיק את כל המידע ויכול לענות מיד ללא צורך בחיפוש
אסיסטנט אישי פנים-ארגוני:
- טען למודל את נהלי החברה, לוח הזמנים, ומידע ארגוני נפוץ
- חבר אותו למערכת הודעות פנימית דרך Make.com
- עובדים יכולים לשאול שאלות ולקבל תשובות מיידיות מבוססות על המידע הפנימי
מערכת FAQ חכמה:
- טען למודל מראש את כל השאלות והתשובות הנפוצות
- חבר אותו לאתר או לבוט צ'אט דרך Make.com
- המבקרים מקבלים מענה מהיר בזמן אמת

דוגמה מעשית: בניית תהליך אוטומציה משולב בעזרת Make.com

בואו נראה איך בונים אוטומציה משולבת שיכולה להשתמש גם ב-RAG וגם ב-CAG, בהתאם לסוג השאלה:

הגדרת הטריגר: נגדיר טופס פנייה באתר או הודעת וואטסאפ נכנסת כטריגר ב-Make.com
ניתוב חכם: נשתמש במודול של OpenAI כדי לסווג את השאלה:
- אם זו שאלה פשוטה שכנראה מכוסה במידע הבסיסי – נשתמש ב-CAG
- אם זו שאלה מורכבת שדורשת חיפוש מתקדם – נשתמש ב-RAG
מסלול ה-CAG: אם השאלה פשוטה, נעביר אותה ישירות למודל שכבר טעון עם המידע הבסיסי
מסלול ה-RAG: אם השאלה מורכבת, נשלח אותה למנוע חיפוש שיאתר את החלקים הרלוונטיים במאגר המידע המורחב, ואז נעביר את התוצאות והשאלה למודל
משלוח התשובה: לבסוף, Make.com ישלח את התשובה חזרה ללקוח דרך הערוץ המתאים

נקודות חשובות ליישום מעשי

שקול את השיקולים העסקיים שלך: האם מהירות תגובה היא קריטית? האם יש לך מאגר ידע עצום? האם המידע מתעדכן לעתים קרובות?
קח בחשבון את העלויות: RAG דורש תחזוקה של מסד נתונים וקטורי, בעוד ש-CAG דורש מודל עם חלון הקשר גדול יותר, שלרוב יקר יותר להפעלה.
שילוב הוא אופציה חזקה: במקרים רבים, שילוב של שתי הגישות יכול לתת את התוצאות הטובות ביותר – CAG למידע בסיסי וקבוע, ו-RAG למידע מורחב ומתעדכן.
עקוב אחרי הביצועים: הגדר מדדים לדיוק ולמהירות התגובה, ובדוק איזו גישה נותנת את התוצאות הטובות ביותר לשימוש הספציפי שלך.

איך RAG ו-CAG קשורים לבניית סוכני AI חכמים יותר?

בעידן העכשווי, סוכני AI הם הדור הבא של אוטומציה חכמה. אלה הם מערכות אוטונומיות שלא רק מגיבות לבקשות אלא גם יוזמות פעולות, מקבלות החלטות, ומבצעות רצף של משימות להשגת מטרה. כשמדובר בסוכני AI, הבחירה בין RAG ו-CAG היא קריטית עוד יותר. סוכנים הפועלים בסביבות עשירות במידע (כמו עוזר מחקר משפטי) יכולים להפיק תועלת רבה יותר מ-RAG בגלל היכולת לחפש באופן דינמי במאגרי מידע עצומים. לעומת זאת, סוכנים המבצעים משימות חוזרות עם מערך ידע מוגדר (כמו עוזר אישי וירטואלי) עשויים לפעול ביעילות רבה יותר עם CAG. הגמישות של Make.com מאפשרת ליצור סוכני AI היברידיים שיכולים לנווט בין שתי הגישות בהתאם למשימה, מה שהופך אותם לחכמים ומסתגלים יותר מכל פתרון אוטומציה מסורתי.

סיכום

RAG ו-CAG הן גישות משלימות להעשרת מודלי שפה עם מידע חיצוני. בעולם האוטומציה, הבחירה בין השתיים תלויה בצרכים הספציפיים שלך, בגודל מאגר המידע, בתדירות העדכונים ובחשיבות של זמן התגובה.

כלים כמו Make.com מאפשרים לך לבנות תהליכי אוטומציה חכמים שמשלבים את הגישות האלה עם מערכות העסקיות שלך – מה שמאפשר לך להעניק שירות טוב יותר, לחסוך זמן יקר, ולהפוך את המידע העסקי שלך לנכס אסטרטגי שמייצר ערך אמיתי.

Z-Solutions

RAG או CAG: איזו גישה הכי מתאימה לסוכני AI שלך?

צרו קשר ואני אחזור אליכם אישית!

מה זה RAG?

מה זה CAG?

ההבדלים המרכזיים בין הגישות

מתי נרצה להשתמש בCAG ומתי נרצה להשתמש בRAG?

שילוב RAG ו-CAG עם אוטומציות ב-Make.com

אוטומציות עם RAG:

אוטומציות עם CAG:

דוגמה מעשית: בניית תהליך אוטומציה משולב בעזרת Make.com

נקודות חשובות ליישום מעשי

איך RAG ו-CAG קשורים לבניית סוכני AI חכמים יותר?

סיכום

אולי זה יכול לעניין מישהו נוסף? אשמח לשיתוף :)

שירותים נוספים שאולי יעניינו אותך:

אימייל מרקטינג

אוטומציה לניהול ותפעול

אוטומציה שיווקית

אוטומציה לוובינרים

רוצים לקבל מידע וטיפים על אוטומציות ושיווק? הירשמו לניוזלטר השבועי שלנו >>

תחומי התמחות

תחומי התמחות

תחומי התמחות

Z-Solutions

הצטרפו לקהילה שלנו: