Python: Core: add experimental memory harness context provider (#5613)

* Python: Core: add experimental memory harness context provider Adds MemoryContextProvider with topic-indexed long-term memory and chat-driven compaction. Pluggable MemoryStore backends include MemoryFileStore. Public types: MemoryIndexEntry, MemoryTopicRecord. Behind @experimental(ExperimentalFeature.HARNESS). Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com> * Python: Core: address review feedback on memory harness - mark MemoryStore as @experimental(HARNESS) for surface consistency - safely encode owner id and verify path containment (matches FileHistoryProvider pattern) - namespace MemoryFileStore on-disk layout by source_id to avoid cross-provider collisions - before_run computes index_entries once and only rewrites MEMORY.md when content changes - asyncio locks around topic/state read-modify-write to avoid concurrent-write races Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com> * Address PR feedback: harden memory store IO + consolidation behavior - Atomic writes via os.replace + temp sibling for topic, state, and index files so crashes/disk-full failures cannot leave a truncated half-written file. - Stop creating directories on read paths: list_topics/read_state/search_transcripts and get_messages return empty when nothing has been written. mkdir is deferred to the actual save path (write_topic/write_state/save_messages). - Escape lines that look like markdown headings on render and unescape them on parse, so a memory or summary containing '## Summary'/'## Memories' cannot tamper with the topic file structure. - Narrow extraction/consolidation chat-client failure handling to ChatClientException, asyncio.TimeoutError, and OSError. Programmer errors (AttributeError, TypeError, ...) now propagate so misconfigured clients fail loudly. - Log a payload-prefix preview for every silent shape branch in _extract_memories and _consolidate_topic so unparsable extractor output is debuggable instead of invisible. - Restructure _run_consolidation: read maintenance state and topic snapshot under the state lock, run the LLM consolidation loop without holding the state lock, and only advance last_consolidated_at/sessions_since_consolidation if at least one topic succeeded. Transient consolidation failures now leave the maintenance window in place so the next after_run retries instead of silently sliding forward. - Add regression tests for: markdown-marker round-trip, atomic-write recovery on os.replace failure, no-mkdir on pure read paths, transient consolidation failure preserves state, and propagation of programmer errors. Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com> --------- Co-authored-by: Copilot <223556219+Copilot@users.noreply.github.com>
2026-06-16 21:04:09 +08:00 · 2026-05-04 23:19:50 +02:00
parent e558d36ff6
commit 4a2da953ca
5 changed files with 2421 additions and 0 deletions
@@ -79,6 +79,14 @@ from ._evaluation import (
    tool_calls_present,
 )
 from ._feature_stage import ExperimentalFeature, ReleaseCandidateFeature
+from ._harness._memory import (
+    DEFAULT_MEMORY_SOURCE_ID,
+    MemoryContextProvider,
+    MemoryFileStore,
+    MemoryIndexEntry,
+    MemoryStore,
+    MemoryTopicRecord,
+)
 from ._mcp import MCPStdioTool, MCPStreamableHTTPTool, MCPWebsocketTool
 from ._middleware import (
    AgentContext,
@@ -261,6 +269,7 @@ __all__ = [
    "APP_INFO",
    "COMPACTION_STATE_KEY",
    "DEFAULT_MAX_ITERATIONS",
+    "DEFAULT_MEMORY_SOURCE_ID",
    "EXCLUDED_KEY",
    "EXCLUDE_REASON_KEY",
    "GROUP_ANNOTATION_KEY",
@@ -355,6 +364,11 @@ __all__ = [
    "MCPStdioTool",
    "MCPStreamableHTTPTool",
    "MCPWebsocketTool",
+    "MemoryContextProvider",
+    "MemoryFileStore",
+    "MemoryIndexEntry",
+    "MemoryStore",
+    "MemoryTopicRecord",
    "Message",
    "MiddlewareException",
    "MiddlewareTermination",
@@ -49,6 +49,7 @@ class ExperimentalFeature(str, Enum):
    EVALS = "EVALS"
    FILE_HISTORY = "FILE_HISTORY"
    FUNCTIONAL_WORKFLOWS = "FUNCTIONAL_WORKFLOWS"
+    HARNESS = "HARNESS"
    SKILLS = "SKILLS"
    TOOLBOXES = "TOOLBOXES"

@@ -0,0 +1,770 @@
+# Copyright (c) Microsoft. All rights reserved.
+
+from __future__ import annotations
+
+import asyncio
+import json
+from collections.abc import Mapping, Sequence
+from datetime import datetime, timedelta, timezone
+from typing import Any
+
+import pytest
+
+from agent_framework import (
+    DEFAULT_MEMORY_SOURCE_ID,
+    Agent,
+    AgentSession,
+    ChatResponse,
+    Content,
+    ExperimentalFeature,
+    FileHistoryProvider,
+    MemoryContextProvider,
+    MemoryFileStore,
+    MemoryIndexEntry,
+    MemoryStore,
+    MemoryTopicRecord,
+    Message,
+)
+
+
+def _tool_by_name(tools: list[object], name: str) -> object:
+    """Return the tool with the requested name from a prepared tool list."""
+    for tool in tools:
+        if getattr(tool, "name", None) == name:
+            return tool
+    raise AssertionError(f"Tool {name!r} was not found.")
+
+
+class _MemoryHarnessClient:
+    """Deterministic chat client used by the memory harness tests."""
+
+    additional_properties: dict[str, Any]
+
+    def __init__(
+        self,
+        *,
+        extraction_payload: dict[str, Any] | None = None,
+        consolidation_payload: dict[str, Any] | None = None,
+        default_text: str = "Assistant reply.",
+    ) -> None:
+        self.additional_properties = {}
+        self.extraction_payload = extraction_payload or {
+            "memories": [
+                {
+                    "topic": "preferences",
+                    "memory": "Prefers concise answers.",
+                }
+            ]
+        }
+        self.consolidation_payload = consolidation_payload or {
+            "summary": "Prefers concise answers.",
+            "memories": ["Prefers concise answers."],
+        }
+        self.default_text = default_text
+        self.calls: list[str] = []
+
+    async def get_response(
+        self,
+        messages: Sequence[Message],
+        *,
+        stream: bool = False,
+        options: Mapping[str, Any] | None = None,
+        compaction_strategy: object | None = None,
+        tokenizer: object | None = None,
+        function_invocation_kwargs: Mapping[str, Any] | None = None,
+        client_kwargs: Mapping[str, Any] | None = None,
+    ) -> ChatResponse[Any]:
+        del options, compaction_strategy, tokenizer, function_invocation_kwargs, client_kwargs
+        assert not stream
+        system_text = messages[0].text if messages and messages[0].role == "system" else ""
+        if "extract durable memory candidates" in system_text.lower():
+            self.calls.append("extract")
+            return ChatResponse(messages=[Message(role="assistant", contents=[json.dumps(self.extraction_payload)])])
+        if "consolidate one topic memory file" in system_text.lower():
+            self.calls.append("consolidate")
+            return ChatResponse(messages=[Message(role="assistant", contents=[json.dumps(self.consolidation_payload)])])
+        self.calls.append("agent")
+        return ChatResponse(messages=[Message(role="assistant", contents=[self.default_text])])
+
+
+def test_memory_index_entry_round_trips_and_trims_pointer_lines() -> None:
+    """Memory index entries should preserve value equality and trim pointer lines."""
+    raw_entry = {
+        "topic": "Architecture Decisions",
+        "slug": "architecture-decisions",
+        "summary": (
+            "PostgreSQL was chosen because it keeps the relational model while supporting flexible JSONB fields."
+        ),
+        "updated_at": "2026-04-21T10:00:00+00:00",
+    }
+
+    entry = MemoryIndexEntry.from_dict(raw_entry)
+
+    assert entry == MemoryIndexEntry(**raw_entry)
+    assert entry.to_dict() == raw_entry
+    assert len(entry.to_pointer_line(max_length=80)) <= 80
+    assert "MemoryIndexEntry(" in repr(entry)
+
+
+def test_memory_topic_record_round_trips_through_dict_and_markdown() -> None:
+    """Topic memory records should preserve their structured content and markdown form."""
+    raw_record = {
+        "topic": "preferences",
+        "slug": "preferences",
+        "summary": "Prefers concise answers.",
+        "memories": ["Prefers concise answers.", "Prefers aisle seats."],
+        "updated_at": "2026-04-21T10:05:00+00:00",
+        "session_ids": ["session-1", "session-2"],
+    }
+
+    record = MemoryTopicRecord.from_dict(raw_record)
+    reparsed_record = MemoryTopicRecord.from_markdown(record.to_markdown())
+
+    assert record == MemoryTopicRecord(**raw_record)
+    assert record.to_dict() == raw_record
+    assert reparsed_record == record
+    assert "MemoryTopicRecord(" in repr(record)
+
+
+async def test_memory_file_store_writes_topics_index_state_and_transcripts(tmp_path) -> None:
+    """The file-backed memory store should manage topics, ``MEMORY.md``, state, and transcript search."""
+    store = MemoryFileStore(
+        tmp_path,
+        kind="memories",
+        owner_prefix="user_",
+        owner_state_key="owner_id",
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    updated_at = datetime(2026, 4, 21, tzinfo=timezone.utc).replace(microsecond=0).isoformat()
+
+    preferences_record = MemoryTopicRecord(
+        topic="preferences",
+        summary="Prefers concise answers.",
+        memories=["Prefers concise answers.", "Prefers aisle seats."],
+        updated_at=updated_at,
+        session_ids=["session-1"],
+    )
+    travel_record = MemoryTopicRecord(
+        topic="travel",
+        summary="Planning a Norway trip.",
+        memories=["Visit Oslo in June."],
+        updated_at=updated_at,
+        session_ids=["session-1"],
+    )
+
+    store.write_topic(session, preferences_record, source_id=DEFAULT_MEMORY_SOURCE_ID)
+    store.write_topic(session, travel_record, source_id=DEFAULT_MEMORY_SOURCE_ID)
+    entries = store.rebuild_index(
+        session,
+        source_id=DEFAULT_MEMORY_SOURCE_ID,
+        line_limit=200,
+        line_length=150,
+    )
+
+    assert [entry.topic for entry in entries] == ["preferences", "travel"]
+    assert "preferences" in store.get_index_text(
+        session,
+        source_id=DEFAULT_MEMORY_SOURCE_ID,
+        line_limit=200,
+        line_length=150,
+    )
+
+    assert store.read_state(session, source_id=DEFAULT_MEMORY_SOURCE_ID) == {
+        "last_consolidated_at": None,
+        "sessions_since_consolidation": [],
+    }
+    store.write_state(
+        session,
+        {
+            "last_consolidated_at": updated_at,
+            "sessions_since_consolidation": ["session-1"],
+        },
+        source_id=DEFAULT_MEMORY_SOURCE_ID,
+    )
+    assert store.read_state(
+        session,
+        source_id=DEFAULT_MEMORY_SOURCE_ID,
+    )["sessions_since_consolidation"] == ["session-1"]
+
+    history_provider = FileHistoryProvider(
+        store.get_transcripts_directory(session, source_id=DEFAULT_MEMORY_SOURCE_ID),
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    await history_provider.save_messages(
+        session.session_id,
+        [
+            Message(role="user", contents=["I prefer aisle seats."]),
+            Message(role="assistant", contents=["Recorded."]),
+        ],
+    )
+
+    assert store.search_transcripts(session, source_id=DEFAULT_MEMORY_SOURCE_ID, query="aisle") == [
+        {
+            "session_id": "session-1",
+            "line_number": 1,
+            "role": "user",
+            "text": "I prefer aisle seats.",
+        }
+    ]
+
+
+def test_memory_file_store_rejects_owner_path_traversal(tmp_path) -> None:
+    """Owner IDs with path traversal segments should not escape ``base_path``."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "../escape"
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    record = MemoryTopicRecord(
+        topic="preferences",
+        summary="Prefers concise answers.",
+        memories=["Prefers concise answers."],
+        updated_at=datetime(2026, 4, 21, tzinfo=timezone.utc).replace(microsecond=0).isoformat(),
+    )
+
+    with pytest.raises(ValueError, match="path traversal"):
+        store.write_topic(session, record, source_id=DEFAULT_MEMORY_SOURCE_ID)
+
+    assert not (tmp_path.parent / "escape").exists()
+
+
+async def test_memory_file_store_namespaces_topics_state_and_transcripts_by_source_id(tmp_path) -> None:
+    """Providers sharing one file store should not collide when they use different source IDs."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(
+        tmp_path,
+        owner_state_key="owner_id",
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    updated_at = datetime(2026, 4, 21, tzinfo=timezone.utc).replace(microsecond=0).isoformat()
+
+    store.write_topic(
+        session,
+        MemoryTopicRecord(
+            topic="preferences",
+            summary="Source A summary.",
+            memories=["Source A memory."],
+            updated_at=updated_at,
+        ),
+        source_id="source-a",
+    )
+    store.write_topic(
+        session,
+        MemoryTopicRecord(
+            topic="preferences",
+            summary="Source B summary.",
+            memories=["Source B memory."],
+            updated_at=updated_at,
+        ),
+        source_id="source-b",
+    )
+    store.write_state(
+        session, {"last_consolidated_at": updated_at, "sessions_since_consolidation": ["a"]}, source_id="source-a"
+    )
+    store.write_state(
+        session, {"last_consolidated_at": None, "sessions_since_consolidation": ["b"]}, source_id="source-b"
+    )
+
+    await FileHistoryProvider(store.get_transcripts_directory(session, source_id="source-a")).save_messages(
+        "session-1", [Message(role="user", contents=["Source A transcript."])]
+    )
+    await FileHistoryProvider(store.get_transcripts_directory(session, source_id="source-b")).save_messages(
+        "session-1", [Message(role="user", contents=["Source B transcript."])]
+    )
+
+    assert store.get_topic(session, source_id="source-a", topic="preferences").memories == ["Source A memory."]
+    assert store.get_topic(session, source_id="source-b", topic="preferences").memories == ["Source B memory."]
+    assert store.read_state(session, source_id="source-a")["sessions_since_consolidation"] == ["a"]
+    assert store.read_state(session, source_id="source-b")["sessions_since_consolidation"] == ["b"]
+    assert (
+        store.search_transcripts(session, source_id="source-a", query="transcript")[0]["text"] == "Source A transcript."
+    )
+    assert (
+        store.search_transcripts(session, source_id="source-b", query="transcript")[0]["text"] == "Source B transcript."
+    )
+
+
+async def test_memory_context_provider_does_not_rewrite_unchanged_index(tmp_path) -> None:
+    """A second before-run pass with unchanged memories should preserve ``MEMORY.md`` mtime."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    agent = Agent(
+        client=_MemoryHarnessClient(),
+        context_providers=[MemoryContextProvider(store=store)],
+        default_options={"store": False},
+    )
+
+    await agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Current question"])],
+    )
+    index_path = next(tmp_path.rglob("MEMORY.md"))
+    first_mtime_ns = index_path.stat().st_mtime_ns
+
+    await agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Current question"])],
+    )
+
+    assert index_path.stat().st_mtime_ns == first_mtime_ns
+
+
+async def test_memory_context_provider_tools_and_automation(tmp_path) -> None:
+    """The memory provider should expose tools and automate extraction plus consolidation."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(
+        tmp_path,
+        kind="memories",
+        owner_prefix="user_",
+        owner_state_key="owner_id",
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    provider = MemoryContextProvider(
+        store=store,
+        consolidation_min_sessions=1,
+        consolidation_interval=timedelta(0),
+    )
+    agent = Agent(
+        client=_MemoryHarnessClient(),
+        context_providers=[provider],
+        default_options={"store": False},
+    )
+
+    _, options = await agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Remember this."])],
+    )
+    tools = options["tools"]
+    assert isinstance(tools, list)
+
+    write_memory = _tool_by_name(tools, "write_memory")
+    list_memory_topics = _tool_by_name(tools, "list_memory_topics")
+    search_memory_transcripts = _tool_by_name(tools, "search_memory_transcripts")
+    consolidate_memories = _tool_by_name(tools, "consolidate_memories")
+
+    write_result = await write_memory.invoke(arguments={"topic": "travel", "memory": "Visit Oslo in June."})
+    created_topic = json.loads(write_result[0].text)
+    assert created_topic["topic"] == "travel"
+
+    list_result = await list_memory_topics.invoke()
+    assert [entry["topic"] for entry in json.loads(list_result[0].text)] == ["travel"]
+
+    await agent.run("Please remember that I prefer concise answers.", session=session)
+
+    serialized_session = session.to_dict()
+    assert serialized_session["state"][DEFAULT_MEMORY_SOURCE_ID] == {"owner_id": "alice"}
+
+    preferences_topic = store.get_topic(session, source_id=DEFAULT_MEMORY_SOURCE_ID, topic="preferences")
+    assert preferences_topic.summary == "Prefers concise answers."
+    assert preferences_topic.memories == ["Prefers concise answers."]
+
+    transcript_search_result = await search_memory_transcripts.invoke(arguments={"query": "concise", "limit": 5})
+    search_payload = json.loads(transcript_search_result[0].text)
+    assert search_payload[0]["role"] == "user"
+    assert "concise answers" in search_payload[0]["text"]
+
+    consolidate_result = await consolidate_memories.invoke()
+    assert json.loads(consolidate_result[0].text)["consolidated_topics"] >= 1
+
+
+async def test_memory_context_provider_injects_recent_turns(tmp_path) -> None:
+    """The memory provider should inject only the configured recent transcript turns."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(
+        tmp_path,
+        kind="memories",
+        owner_prefix="user_",
+        owner_state_key="owner_id",
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    provider = MemoryContextProvider(store=store, recent_turns=2)
+    provider_state = store.export_provider_state(session)
+    await provider.save_messages(
+        session.session_id,
+        [
+            Message(role="user", contents=["First question"]),
+            Message(role="assistant", contents=["First answer"]),
+            Message(role="user", contents=["Second question"]),
+            Message(role="assistant", contents=["Second answer"]),
+            Message(role="user", contents=["Third question"]),
+            Message(role="assistant", contents=["Third answer"]),
+        ],
+        state=provider_state,
+    )
+    agent = Agent(
+        client=_MemoryHarnessClient(),
+        context_providers=[provider],
+        default_options={"store": False},
+    )
+
+    session_context, _ = await agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Current question"])],
+    )
+    prepared_messages = session_context.get_messages(include_input=True)
+
+    assert [message.text for message in prepared_messages[:4]] == [
+        "Second question",
+        "Second answer",
+        "Third question",
+        "Third answer",
+    ]
+    assert "First question" not in [message.text for message in prepared_messages]
+    assert "### MEMORY.md" in prepared_messages[4].text
+    assert prepared_messages[-1].text == "Current question"
+
+
+async def test_memory_context_provider_recent_turns_can_skip_tool_call_groups(tmp_path) -> None:
+    """Recent-turn loading should follow compaction grouping and optionally skip tool-call groups."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(
+        tmp_path,
+        kind="memories",
+        owner_prefix="user_",
+        owner_state_key="owner_id",
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    provider_state = store.export_provider_state(session)
+    await MemoryContextProvider(store=store).save_messages(
+        session.session_id,
+        [
+            Message(role="user", contents=["First question"]),
+            Message(role="assistant", contents=["First answer"]),
+            Message(role="user", contents=["Second question"]),
+            Message(role="assistant", contents=[Content.from_text_reasoning(text="Let me check that.")]),
+            Message(
+                role="assistant",
+                contents=[
+                    Content.from_function_call(call_id="call-1", name="lookup_answer", arguments='{"topic":"second"}')
+                ],
+            ),
+            Message(role="tool", contents=[Content.from_function_result(call_id="call-1", result="Tool result")]),
+            Message(role="assistant", contents=["Second final answer"]),
+            Message(role="user", contents=["Third question"]),
+            Message(role="assistant", contents=["Third answer"]),
+        ],
+        state=provider_state,
+    )
+    with_tools_agent = Agent(
+        client=_MemoryHarnessClient(),
+        context_providers=[MemoryContextProvider(store=store, recent_turns=2, load_tool_turns=True)],
+        default_options={"store": False},
+    )
+    without_tools_agent = Agent(
+        client=_MemoryHarnessClient(),
+        context_providers=[MemoryContextProvider(store=store, recent_turns=2, load_tool_turns=False)],
+        default_options={"store": False},
+    )
+
+    with_tools_context, _ = await with_tools_agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Current question"])],
+    )
+    without_tools_context, _ = await without_tools_agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Current question"])],
+    )
+    with_tools_messages = with_tools_context.get_messages(include_input=True)
+    without_tools_messages = without_tools_context.get_messages(include_input=True)
+
+    assert [message.text for message in without_tools_messages[:4]] == [
+        "Second question",
+        "Second final answer",
+        "Third question",
+        "Third answer",
+    ]
+    assert not any(message.role == "tool" for message in without_tools_messages)
+    assert not any(
+        any(content.type == "function_call" for content in message.contents) for message in without_tools_messages
+    )
+    assert not any(
+        any(content.type == "text_reasoning" for content in message.contents) for message in without_tools_messages
+    )
+
+    assert with_tools_messages[0].text == "Second question"
+    assert with_tools_messages[1].contents[0].type == "text_reasoning"
+    assert with_tools_messages[2].contents[0].type == "function_call"
+    assert with_tools_messages[3].role == "tool"
+    assert with_tools_messages[3].contents[0].type == "function_result"
+    assert with_tools_messages[4].text == "Second final answer"
+
+
+async def test_memory_context_provider_uses_explicit_consolidation_client(tmp_path) -> None:
+    """The memory provider should use the explicit consolidation client when one is configured."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(
+        tmp_path,
+        kind="memories",
+        owner_prefix="user_",
+        owner_state_key="owner_id",
+        dumps=lambda value: json.dumps(value, separators=(",", ":"), sort_keys=True),
+        loads=json.loads,
+    )
+    main_client = _MemoryHarnessClient()
+    consolidation_client = _MemoryHarnessClient(
+        consolidation_payload={
+            "summary": "Consolidated by the cheaper client.",
+            "memories": ["Visit Oslo in June."],
+        }
+    )
+    provider = MemoryContextProvider(
+        store=store,
+        consolidation_client=consolidation_client,
+    )
+    agent = Agent(
+        client=main_client,
+        context_providers=[provider],
+        default_options={"store": False},
+    )
+
+    _, options = await agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Remember this."])],
+    )
+    tools = options["tools"]
+    assert isinstance(tools, list)
+
+    write_memory = _tool_by_name(tools, "write_memory")
+    consolidate_memories = _tool_by_name(tools, "consolidate_memories")
+
+    await write_memory.invoke(arguments={"topic": "travel", "memory": "Visit Oslo in June."})
+    await consolidate_memories.invoke()
+
+    travel_topic = store.get_topic(session, source_id=DEFAULT_MEMORY_SOURCE_ID, topic="travel")
+    assert travel_topic.summary == "Consolidated by the cheaper client."
+    assert main_client.calls == []
+    assert consolidation_client.calls == ["consolidate"]
+
+
+async def test_memory_context_provider_preserves_concurrent_writes_to_same_topic(tmp_path) -> None:
+    """Concurrent writes to one topic should preserve every memory line."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    provider = MemoryContextProvider(store=store)
+    agent = Agent(client=_MemoryHarnessClient(), context_providers=[provider], default_options={"store": False})
+
+    _, options = await agent._prepare_session_and_messages(  # type: ignore[reportPrivateUsage]
+        session=session,
+        input_messages=[Message(role="user", contents=["Remember these."])],
+    )
+    tools = options["tools"]
+    assert isinstance(tools, list)
+    write_memory = _tool_by_name(tools, "write_memory")
+    memories = [f"Concurrent memory {index}." for index in range(20)]
+
+    await asyncio.gather(
+        *(write_memory.invoke(arguments={"topic": "preferences", "memory": memory}) for memory in memories)
+    )
+
+    topic = store.get_topic(session, source_id=DEFAULT_MEMORY_SOURCE_ID, topic="preferences")
+    assert sorted(topic.memories) == sorted(memories)
+
+
+def test_memory_harness_classes_are_marked_experimental() -> None:
+    """Memory harness public classes should expose HARNESS experimental metadata."""
+    assert MemoryIndexEntry.__feature_id__ == ExperimentalFeature.HARNESS.value
+    assert MemoryTopicRecord.__feature_id__ == ExperimentalFeature.HARNESS.value
+    assert MemoryStore.__feature_id__ == ExperimentalFeature.HARNESS.value
+    assert MemoryFileStore.__feature_id__ == ExperimentalFeature.HARNESS.value
+    assert MemoryContextProvider.__feature_id__ == ExperimentalFeature.HARNESS.value
+    assert ".. warning:: Experimental" in MemoryContextProvider.__doc__
+
+
+def test_memory_topic_record_round_trips_when_text_contains_section_markers() -> None:
+    """Embedded ``## Summary``/``## Memories`` markers must not be re-interpreted as headings."""
+    record = MemoryTopicRecord(
+        topic="weird",
+        summary="Multi line summary.\n## Summary\nstill summary",
+        memories=[
+            "## Memories pretend",
+            "Real memory.",
+            "  ## Memories nested",
+        ],
+        updated_at="2026-04-21T10:00:00+00:00",
+        session_ids=["session-1"],
+    )
+
+    reparsed = MemoryTopicRecord.from_markdown(record.to_markdown())
+
+    assert reparsed.summary == record.summary
+    assert reparsed.memories == record.memories
+
+
+async def test_memory_file_store_atomic_write_preserves_prior_topic_on_failure(tmp_path, monkeypatch) -> None:
+    """If ``os.replace`` fails mid-write, the previous topic file must remain intact."""
+    from agent_framework._harness import _memory as memory_module
+
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    original = MemoryTopicRecord(
+        topic="preferences",
+        summary="Prefers concise answers.",
+        memories=["Prefers concise answers."],
+        updated_at="2026-04-21T10:00:00+00:00",
+        session_ids=["session-1"],
+    )
+    store.write_topic(session, original, source_id=DEFAULT_MEMORY_SOURCE_ID)
+
+    real_replace = memory_module.os.replace
+
+    def _boom(*args: object, **kwargs: object) -> None:
+        raise OSError("simulated disk-full")
+
+    monkeypatch.setattr(memory_module.os, "replace", _boom)
+    with pytest.raises(OSError, match="simulated disk-full"):
+        store.write_topic(
+            session,
+            MemoryTopicRecord(
+                topic="preferences",
+                summary="Updated.",
+                memories=["Updated."],
+                updated_at="2026-04-21T11:00:00+00:00",
+                session_ids=["session-1"],
+            ),
+            source_id=DEFAULT_MEMORY_SOURCE_ID,
+        )
+
+    monkeypatch.setattr(memory_module.os, "replace", real_replace)
+    surviving = store.get_topic(session, source_id=DEFAULT_MEMORY_SOURCE_ID, topic="preferences")
+    assert surviving.summary == "Prefers concise answers."
+    # Temp file should not be left behind.
+    topics_dir = surviving_dir = tmp_path
+    leftover = [path for path in topics_dir.rglob("*.tmp.*")]
+    assert leftover == []
+    del surviving_dir
+
+
+async def test_memory_file_store_does_not_mkdir_on_pure_read_paths(tmp_path) -> None:
+    """List/read calls on a never-written session should not create any directories."""
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+
+    assert store.list_topics(session, source_id=DEFAULT_MEMORY_SOURCE_ID) == []
+    assert store.read_state(session, source_id=DEFAULT_MEMORY_SOURCE_ID) == {
+        "last_consolidated_at": None,
+        "sessions_since_consolidation": [],
+    }
+    assert store.search_transcripts(session, source_id=DEFAULT_MEMORY_SOURCE_ID, query="anything") == []
+
+    # tmp_path itself was passed in by pytest so it exists; assert no children were created.
+    assert list(tmp_path.iterdir()) == []
+
+
+class _RaisingMemoryClient:
+    """Chat client that raises a transient error for every consolidation request."""
+
+    additional_properties: dict[str, Any]
+
+    def __init__(self) -> None:
+        from agent_framework.exceptions import ChatClientException
+
+        self.additional_properties = {}
+        self.error_class = ChatClientException
+        self.calls: list[str] = []
+
+    async def get_response(
+        self,
+        messages: Sequence[Message],
+        *,
+        stream: bool = False,
+        options: Mapping[str, Any] | None = None,
+        compaction_strategy: object | None = None,
+        tokenizer: object | None = None,
+        function_invocation_kwargs: Mapping[str, Any] | None = None,
+        client_kwargs: Mapping[str, Any] | None = None,
+    ) -> ChatResponse[Any]:
+        del messages, stream, options, compaction_strategy, tokenizer
+        del function_invocation_kwargs, client_kwargs
+        self.calls.append("call")
+        raise self.error_class("simulated transient failure")
+
+
+class _ProgrammerErrorMemoryClient:
+    """Chat client whose ``get_response`` raises a non-transient programmer error."""
+
+    additional_properties: dict[str, Any]
+
+    def __init__(self) -> None:
+        self.additional_properties = {}
+
+    async def get_response(self, *args: object, **kwargs: object) -> ChatResponse[Any]:
+        del args, kwargs
+        raise AttributeError("misconfigured client")
+
+
+async def test_memory_consolidation_transient_failure_preserves_state(tmp_path) -> None:
+    """A transient consolidation failure must not advance the maintenance window."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    raising_client = _RaisingMemoryClient()
+    provider = MemoryContextProvider(store=store, consolidation_client=raising_client)
+    pre_state = {
+        "last_consolidated_at": "2026-04-20T09:00:00+00:00",
+        "sessions_since_consolidation": ["queued-session"],
+    }
+    store.write_state(session, pre_state, source_id=DEFAULT_MEMORY_SOURCE_ID)
+    store.write_topic(
+        session,
+        MemoryTopicRecord(
+            topic="preferences",
+            summary="Prefers concise answers.",
+            memories=["Prefers concise answers."],
+            updated_at="2026-04-21T10:00:00+00:00",
+            session_ids=["session-1"],
+        ),
+        source_id=DEFAULT_MEMORY_SOURCE_ID,
+    )
+
+    consolidated_count = await provider._run_consolidation(  # type: ignore[reportPrivateUsage]
+        client=raising_client,
+        session=session,
+        force=True,
+        now=datetime(2026, 4, 22, tzinfo=timezone.utc),
+    )
+
+    assert consolidated_count == 0
+    assert raising_client.calls == ["call"]
+    assert store.read_state(session, source_id=DEFAULT_MEMORY_SOURCE_ID) == pre_state
+    surviving = store.get_topic(session, source_id=DEFAULT_MEMORY_SOURCE_ID, topic="preferences")
+    assert surviving.summary == "Prefers concise answers."
+
+
+async def test_memory_extraction_propagates_programmer_errors(tmp_path) -> None:
+    """Non-transient errors from the chat client must surface so misconfigurations fail loudly."""
+    session = AgentSession(session_id="session-1")
+    session.state["owner_id"] = "alice"
+    store = MemoryFileStore(tmp_path, owner_state_key="owner_id")
+    provider = MemoryContextProvider(store=store)
+    bad_client = _ProgrammerErrorMemoryClient()
+
+    from agent_framework import AgentResponse
+    from agent_framework._sessions import SessionContext
+
+    context = SessionContext(
+        input_messages=[Message(role="user", contents=["q"])],
+    )
+    context._response = AgentResponse(messages=[Message(role="assistant", contents=["a"])])  # type: ignore[reportPrivateUsage]
+
+    with pytest.raises(AttributeError, match="misconfigured client"):
+        await provider._extract_memories(  # type: ignore[reportPrivateUsage]
+            client=bad_client,
+            session=session,
+            context=context,
+            now=datetime(2026, 4, 22, tzinfo=timezone.utc),
+        )