Vì sao AI Agent thường “nhớ nhớ quên quên” và Anthropic đang giải quyết vấn đề này như thế nào?

AI Agent đang được kỳ vọng sẽ trở thành trợ lý công việc thế hệ mới: có thể tự xử lý tác vụ, theo dõi tiến độ, hỗ trợ nghiên cứu, quản lý dự án và phối hợp với con người trong thời gian dài. Tuy nhiên, để làm được điều đó, AI Agent cần một năng lực rất quan trọng: khả năng ghi nhớ liên tục.

Vấn đề là nhiều AI Agent hiện nay vẫn hoạt động theo kiểu “mỗi phiên là một lần bắt đầu lại”. Khi phiên làm việc kết thúc, phần lớn ngữ cảnh cũng biến mất. Sang phiên mới, agent có thể không biết trước đó đã làm gì, người dùng đã cung cấp thông tin nào, nhiệm vụ nào đã hoàn thành và việc nào còn dang dở.

Đây không chỉ là một bất tiện nhỏ. Với AI Agent, việc thiếu bộ nhớ dài hạn có thể khiến chúng khó trở thành trợ lý đáng tin cậy trong môi trường làm việc thực tế.

Chatbot có thể quên, nhưng AI Agent thì không nên

Với chatbot thông thường như ChatGPT hay Claude, việc chỉ xử lý trong phạm vi một cuộc trò chuyện đôi khi vẫn có thể chấp nhận được. Người dùng đặt câu hỏi, chatbot trả lời, cuộc hội thoại kết thúc.

Nhưng AI Agent lại có vai trò khác.

Agent không chỉ trả lời câu hỏi. Chúng được thiết kế để thực hiện những nhiệm vụ phức tạp, kéo dài qua nhiều ngày, nhiều tuần hoặc nhiều phiên làm việc. Ví dụ:

Một AI Agent hỗ trợ quản lý dự án cần nhớ các deadline, đầu việc đang triển khai và quyết định đã thống nhất.

Một AI Agent nghiên cứu tài liệu cần biết mình đã đọc những nguồn nào, đã rút ra kết luận gì và còn thiếu dữ liệu nào.

Một AI Agent hỗ trợ kinh doanh cần ghi nhớ thông tin khách hàng, trạng thái trao đổi và các bước tiếp theo trong quy trình bán hàng.

Nếu mỗi lần mở phiên mới, agent đều phải bắt đầu lại từ con số không, thì dù mô hình có thông minh đến đâu, nó vẫn khó trở thành một cộng sự dài hạn.

Anthropic đề xuất hướng tiếp cận mới cho bộ nhớ của AI Agent

Theo phần trình bày kỹ thuật được nhắc đến từ Anthropic, bài toán “trí nhớ” của AI Agent có thể được xử lý bằng một kiến trúc gồm hai thành phần chính: Memory Store và Dreaming.

Trong đó, Memory Store đóng vai trò như kho lưu trữ ký ức của agent, còn Dreaming là cơ chế giúp rà soát, làm sạch và tối ưu hóa kho ký ức đó theo thời gian.

Có thể hiểu đơn giản: Memory Store giúp agent nhớ, còn Dreaming giúp agent nhớ đúng, nhớ gọn và nhớ có tổ chức hơn.

Memory Store: Kho lưu trữ giúp agent kết nối các phiên làm việc

Memory Store được thiết kế như một không gian lưu trữ riêng, có thể gắn vào từng phiên làm việc của AI Agent. Thay vì chỉ dựa vào lịch sử hội thoại ngắn hạn, agent có thể truy cập vào kho này để xem lại thông tin từ các phiên trước.

Điểm đáng chú ý là Memory Store được triển khai theo hướng giống một hệ thống tệp. Nhờ đó, agent có thể tìm kiếm, đọc và cập nhật thông tin theo cấu trúc quen thuộc, thay vì phải phụ thuộc hoàn toàn vào một cơ sở dữ liệu phức tạp.

Cách tiếp cận này giúp bộ nhớ của agent trở nên linh hoạt hơn. Mỗi người dùng, mỗi nhóm làm việc hoặc mỗi dự án đều có thể có một Memory Store riêng. Như vậy, thông tin không bị trộn lẫn giữa các bối cảnh khác nhau.

Ví dụ, một agent hỗ trợ phòng marketing có thể có Memory Store riêng cho kế hoạch nội dung, chiến dịch quảng cáo, lịch đăng bài và insight khách hàng. Trong khi đó, một agent hỗ trợ phòng kỹ thuật có thể lưu tài liệu hệ thống, lỗi đã xử lý, quy trình triển khai và các quyết định kỹ thuật.

Gắn Memory Store vào phiên làm việc

Khi bắt đầu một phiên làm việc mới, lập trình viên có thể gắn Memory Store phù hợp vào phiên đó. Agent sau đó sẽ đọc lại các thông tin liên quan trước khi tiếp tục xử lý nhiệm vụ.

Ngoài ra, hệ thống có thể được cấu hình để hướng dẫn agent nên ghi nhớ loại thông tin nào. Ví dụ, với một agent đầu tư, bộ nhớ có thể ưu tiên lưu các quyết định, giả định phân tích, danh mục theo dõi và khẩu vị rủi ro. Với một agent quản lý dự án, bộ nhớ có thể tập trung vào deadline, người phụ trách, trạng thái công việc và các quyết định đã được phê duyệt.

Quyền truy cập cũng có thể được kiểm soát. Agent có thể được phép đọc và ghi vào Memory Store, hoặc chỉ được phép đọc nếu người dùng không muốn agent tự ý thay đổi dữ liệu.

Điều này rất quan trọng trong môi trường doanh nghiệp, nơi dữ liệu cần được kiểm soát chặt chẽ. Không phải thông tin nào AI cũng nên được phép chỉnh sửa.

Agent có thể tự tổ chức bộ nhớ

Một điểm thú vị của Memory Store là agent không chỉ ghi thông tin một cách rời rạc. Theo thiết kế, agent có thể tự sắp xếp dữ liệu thành các thư mục, tệp hoặc nhóm nội dung phù hợp.

Chẳng hạn, trong một dự án dài hạn, agent có thể chia bộ nhớ thành các phần như:

Thông tin tổng quan dự án

Các quyết định quan trọng

Danh sách công việc

Tài liệu đã đọc

Vấn đề còn tồn đọng

Kết luận sau từng phiên làm việc

Người dùng hoặc lập trình viên cũng có thể định hướng trước cấu trúc này để agent ghi nhớ theo đúng nhu cầu thực tế. Nếu có thông tin sai, người dùng vẫn có thể chỉnh sửa thủ công để đảm bảo bộ nhớ luôn chính xác.

Dreaming: Cơ chế làm sạch và tối ưu bộ nhớ

Khi AI Agent làm việc trong thời gian dài, Memory Store sẽ ngày càng lớn. Nếu không được xử lý, kho bộ nhớ có thể gặp nhiều vấn đề: thông tin bị trùng lặp, dữ liệu cũ không còn đúng, ghi chú thiếu ngày tháng, kết luận rời rạc hoặc khó tìm kiếm.

Đây là lúc Dreaming phát huy vai trò.

Dreaming có thể được hiểu là một quá trình rà soát bộ nhớ ở chế độ nền. Thay vì để agent cứ ghi nhớ liên tục mà không kiểm tra lại, Dreaming giúp xem xét các phiên làm việc cũ, tổng hợp thông tin quan trọng, loại bỏ nội dung thừa và cập nhật cấu trúc bộ nhớ.

Nói cách khác, Dreaming giống như việc một trợ lý cuối ngày ngồi lại sắp xếp toàn bộ ghi chú: việc gì quan trọng thì giữ lại, thông tin nào trùng thì gộp, dữ liệu nào cũ thì đánh dấu, nội dung nào thiếu thì bổ sung thêm ngữ cảnh.

Vì sao Dreaming quan trọng?

Bộ nhớ dài hạn chỉ hữu ích khi nó có chất lượng tốt. Nếu agent ghi nhớ quá nhiều nhưng không biết đâu là thông tin quan trọng, bộ nhớ đó có thể trở thành gánh nặng.

Một AI Agent có bộ nhớ lộn xộn sẽ dễ gặp các vấn đề như:

Truy xuất sai thông tin

Dựa vào dữ liệu đã lỗi thời

Lặp lại kết luận cũ

Không phân biệt được quyết định chính thức và ghi chú tạm thời

Tốn nhiều chi phí xử lý vì phải đọc quá nhiều dữ liệu không cần thiết

Dreaming giúp giảm các rủi ro này bằng cách biến bộ nhớ thô thành bộ nhớ có tổ chức. Đây là bước quan trọng để AI Agent có thể hoạt động ổn định trong các tác vụ dài hạn.

Con người vẫn giữ quyền kiểm soát

Một điểm đáng chú ý trong cách tiếp cận này là Dreaming không trực tiếp ghi đè lên Memory Store gốc. Thay vào đó, nó tạo ra một phiên bản bộ nhớ mới sau khi đã được xử lý.

Người dùng hoặc lập trình viên có thể xem lại sự khác biệt giữa bản cũ và bản mới: tệp nào được thêm, nội dung nào được chỉnh sửa, thông tin nào bị loại bỏ. Sau khi kiểm tra, họ mới quyết định có sử dụng Memory Store mới cho các phiên tiếp theo hay không.

Cách làm này giúp tránh tình trạng AI tự thay đổi bộ nhớ quan trọng mà không có sự giám sát. Trong môi trường doanh nghiệp, đây là yếu tố rất cần thiết, đặc biệt khi agent được dùng cho quản lý dự án, tài chính, pháp lý, nhân sự hoặc dữ liệu khách hàng.

Từ công cụ trả lời sang cộng sự dài hạn

Nhìn tổng thể, mô hình này cho thấy một bước tiến quan trọng trong cách xây dựng AI Agent.

Trước đây, để agent có ngữ cảnh, lập trình viên thường phải “nhồi” rất nhiều thông tin vào đầu mỗi phiên làm việc. Cách này vừa tốn chi phí, vừa không hiệu quả khi lượng dữ liệu ngày càng lớn.

Với Memory Store và Dreaming, agent có thể duy trì bộ nhớ riêng, truy xuất thông tin cần thiết và cải thiện chất lượng bộ nhớ theo thời gian. Điều này giúp AI Agent tiến gần hơn đến vai trò một cộng sự công việc thực sự, thay vì chỉ là một chatbot thông minh.

Kết luận

AI Agent muốn trở thành trợ lý đáng tin cậy thì không thể chỉ thông minh trong từng phiên làm việc riêng lẻ. Chúng cần nhớ được bối cảnh, hiểu lịch sử công việc, biết điều gì đã xảy ra và tiếp tục nhiệm vụ một cách liền mạch.

Memory Store giúp agent có trí nhớ liên tục. Dreaming giúp bộ nhớ đó sạch hơn, chính xác hơn và dễ sử dụng hơn.

Nếu hướng tiếp cận này được triển khai rộng rãi, AI Agent trong tương lai có thể không còn là công cụ “hỏi gì đáp nấy”, mà trở thành một cộng sự có khả năng theo sát công việc, ghi nhớ tiến trình và hỗ trợ con người trong những nhiệm vụ dài hạn.

Nguyễn Anh Lương

Nguyễn Anh Lương là chuyên gia lập trình với kinh nghiệm thực chiến trong lĩnh vực công nghệ phần mềm từ năm 2013 đến nay. Anh có thế mạnh về phát triển hệ thống từ back-end, front-end đến cơ sở dữ liệu cũng như kinh nghiệm quản lý và deploy ứng dụng lên máy chủ, đồng thời sở hữu nhiều kinh nghiệm ứng dụng AI vào học tập và phát triển giải pháp thực tế. Bên cạnh công việc phát triển phần mềm, anh còn là giảng viên nhiều năm tại Bách Khoa – Aptech, nơi anh đào tạo và đồng hành cùng hàng ngàn học viên theo định hướng thực tiễn và tư duy lập trình chuyên nghiệp.

Xem hồ sơ Liên hệ tư vấn