fix review comments

seratch · seratch · commit c2ab16acfc3c · 2026-03-17T15:52:08.000+09:00
diff --git a/src/agents/memory/openai_responses_compaction_session.py b/src/agents/memory/openai_responses_compaction_session.py
@@ -168,15 +168,6 @@ def _resolve_compaction_mode(
         if not self._has_pending_local_history_rewrite:
             return resolved_mode
 
-        if (
-            self._local_history_rewrite_response_id is not None
-            and response_id is not None
-            and response_id != self._local_history_rewrite_response_id
-        ):
-            self._has_pending_local_history_rewrite = False
-            self._local_history_rewrite_response_id = None
-            return resolved_mode
-
         if resolved_mode == "previous_response_id":
             if self._local_history_rewrite_response_id is None and response_id is not None:
                 self._local_history_rewrite_response_id = response_id
@@ -321,6 +312,8 @@ async def run_compaction(self, args: OpenAIResponsesCompactionArgs | None = None
 
         self._compaction_candidate_items = select_compaction_candidate_items(output_items)
         self._session_items = output_items
+        if resolved_mode == "input":
+            self._clear_pending_local_history_rewrite()
 
         logger.debug(
             f"compact: done for {self._response_id} "
@@ -435,6 +428,10 @@ def _mark_local_history_rewrite(self) -> None:
         self._has_pending_local_history_rewrite = True
         self._local_history_rewrite_response_id = self._response_id
 
+    def _clear_pending_local_history_rewrite(self) -> None:
+        self._has_pending_local_history_rewrite = False
+        self._local_history_rewrite_response_id = None
+
 
 _ResolvedCompactionMode = Literal["previous_response_id", "input"]
 
diff --git a/src/agents/run.py b/src/agents/run.py
@@ -55,6 +55,7 @@
     input_guardrails_triggered,
     resolve_processed_response,
     resolve_resumed_context,
+    resolve_trace_include_sensitive_data,
     resolve_trace_settings,
     save_turn_items_if_needed,
     should_cancel_parallel_model_task_on_input_guardrail_trip,
@@ -412,6 +413,7 @@ async def run(
         auto_previous_response_id = kwargs.get("auto_previous_response_id", False)
         conversation_id = kwargs.get("conversation_id")
         session = kwargs.get("session")
+        run_config_was_supplied = run_config is not None
 
         if run_config is None:
             run_config = RunConfig()
@@ -511,10 +513,15 @@ async def run(
             history_is_server_managed=history_is_server_managed,
         )
 
-        if is_resumed_state and run_state is not None:
+        resolved_trace_include_sensitive_data = resolve_trace_include_sensitive_data(
+            run_state=run_state,
+            run_config=run_config,
+            run_config_was_supplied=run_config_was_supplied,
+        )
+        if resolved_trace_include_sensitive_data != run_config.trace_include_sensitive_data:
             run_config = dataclasses.replace(
                 run_config,
-                trace_include_sensitive_data=run_state._trace_include_sensitive_data,
+                trace_include_sensitive_data=resolved_trace_include_sensitive_data,
             )
 
         resolved_reasoning_item_id_policy: ReasoningItemIdPolicy | None = (
@@ -1462,6 +1469,7 @@ def run_streamed(
         auto_previous_response_id = kwargs.get("auto_previous_response_id", False)
         conversation_id = kwargs.get("conversation_id")
         session = kwargs.get("session")
+        run_config_was_supplied = run_config is not None
 
         if run_config is None:
             run_config = RunConfig()
@@ -1553,10 +1561,15 @@ def run_streamed(
             session=session,
             history_is_server_managed=history_is_server_managed,
         )
-        if is_resumed_state and run_state is not None:
+        resolved_trace_include_sensitive_data = resolve_trace_include_sensitive_data(
+            run_state=run_state,
+            run_config=run_config,
+            run_config_was_supplied=run_config_was_supplied,
+        )
+        if resolved_trace_include_sensitive_data != run_config.trace_include_sensitive_data:
             run_config = dataclasses.replace(
                 run_config,
-                trace_include_sensitive_data=run_state._trace_include_sensitive_data,
+                trace_include_sensitive_data=resolved_trace_include_sensitive_data,
             )
 
         resolved_reasoning_item_id_policy: ReasoningItemIdPolicy | None = (
diff --git a/src/agents/run_internal/agent_runner_helpers.py b/src/agents/run_internal/agent_runner_helpers.py
@@ -43,6 +43,7 @@
     "ensure_context_wrapper",
     "finalize_conversation_tracking",
     "input_guardrails_triggered",
+    "resolve_trace_include_sensitive_data",
     "validate_session_conversation_settings",
     "resolve_trace_settings",
     "resolve_processed_response",
@@ -178,6 +179,18 @@ def resolve_trace_settings(
     return workflow_name, trace_id, group_id, metadata, tracing
 
 
+def resolve_trace_include_sensitive_data(
+    *,
+    run_state: RunState[TContext] | None,
+    run_config: RunConfig,
+    run_config_was_supplied: bool,
+) -> bool:
+    """Resolve whether traces may include sensitive data for this run."""
+    if run_state is None or run_config_was_supplied:
+        return run_config.trace_include_sensitive_data
+    return run_state._trace_include_sensitive_data
+
+
 def resolve_resumed_context(
     *,
     run_state: RunState[TContext],
diff --git a/tests/memory/test_openai_responses_compaction_session.py b/tests/memory/test_openai_responses_compaction_session.py
@@ -416,6 +416,75 @@ async def test_run_compaction_forces_input_mode_after_local_history_rewrite(self
         second_call_kwargs = mock_client.responses.compact.call_args.kwargs
         assert second_call_kwargs.get("previous_response_id") == "resp-2"
 
+    @pytest.mark.asyncio
+    async def test_run_compaction_keeps_local_rewrite_pending_until_input_compaction_succeeds(
+        self,
+    ) -> None:
+        underlying = RewriteAwareSimpleSession(
+            history=[
+                cast(TResponseInputItem, {"type": "message", "role": "user", "content": "hello"}),
+                cast(
+                    TResponseInputItem,
+                    {
+                        "type": "function_call",
+                        "call_id": "call-1",
+                        "id": "fc_1",
+                        "name": "test_tool",
+                        "arguments": '{"value":"foo"}',
+                    },
+                ),
+                cast(
+                    TResponseInputItem,
+                    {
+                        "type": "function_call_output",
+                        "call_id": "call-1",
+                        "output": "ok",
+                    },
+                ),
+            ]
+        )
+        mock_compact_response = MagicMock()
+        mock_compact_response.output = []
+        mock_client = MagicMock()
+        mock_client.responses.compact = AsyncMock(return_value=mock_compact_response)
+        session = OpenAIResponsesCompactionSession(
+            session_id="test",
+            underlying_session=underlying,
+            client=mock_client,
+            compaction_mode="auto",
+        )
+
+        await session.apply_history_mutations(
+            {
+                "mutations": [
+                    {
+                        "type": "replace_function_call",
+                        "call_id": "call-1",
+                        "replacement": cast(
+                            TResponseInputItem,
+                            {
+                                "type": "function_call",
+                                "call_id": "call-1",
+                                "id": "fc_1",
+                                "name": "test_tool",
+                                "arguments": '{"value":"bar"}',
+                            },
+                        ),
+                    }
+                ]
+            }
+        )
+
+        await session.run_compaction({"response_id": "resp-1"})
+        mock_client.responses.compact.assert_not_called()
+
+        await session.run_compaction({"response_id": "resp-2", "force": True})
+
+        call_kwargs = mock_client.responses.compact.call_args.kwargs
+        assert "previous_response_id" not in call_kwargs
+        assert isinstance(call_kwargs.get("input"), list)
+        assert cast(dict[str, Any], call_kwargs["input"][1])["arguments"] == '{"value":"bar"}'
+
     @pytest.mark.asyncio
     async def test_run_compaction_auto_uses_default_store_when_unset(self) -> None:
         mock_session = self.create_mock_session()
diff --git a/tests/test_agent_tracing.py b/tests/test_agent_tracing.py
@@ -1,6 +1,7 @@
 from __future__ import annotations
 
 import asyncio
+from typing import Any
 from uuid import uuid4
 
 import pytest
@@ -27,6 +28,18 @@ def approval_tool() -> str:
     return Agent(name="test_agent", model=model, tools=[approval_tool])
 
 
+def _get_last_function_span_export(name: str) -> dict[str, Any]:
+    matching_spans = [
+        exported
+        for span in fetch_ordered_spans()
+        if (exported := span.export()) is not None
+        and exported["span_data"]["type"] == "function"
+        and exported["span_data"]["name"] == name
+    ]
+    assert matching_spans
+    return matching_spans[-1]
+
+
 @pytest.mark.asyncio
 async def test_single_run_is_single_trace():
     agent = Agent(
@@ -358,6 +371,45 @@ async def test_completed_result_to_state_preserves_sensitive_trace_flag() -> Non
     assert state._trace_include_sensitive_data is False
 
 
+@pytest.mark.asyncio
+async def test_resumed_run_honors_explicit_trace_include_sensitive_data() -> None:
+    model = FakeModel()
+
+    @function_tool(name_override="send_email", needs_approval=True)
+    def send_email(recipient: str) -> str:
+        return recipient
+
+    agent = Agent(name="trace_agent", model=model, tools=[send_email])
+    model.add_multiple_turn_outputs(
+        [
+            [
+                get_function_tool_call(
+                    "send_email", '{"recipient":"alice@example.com"}', call_id="call-1"
+                )
+            ],
+            [get_text_message("done")],
+        ]
+    )
+
+    first = await Runner.run(agent, input="first_test")
+    assert first.interruptions
+
+    state = first.to_state()
+    state.approve(first.interruptions[0], override_arguments={"recipient": "bob@example.com"})
+
+    resumed = await Runner.run(
+        agent,
+        state,
+        run_config=RunConfig(trace_include_sensitive_data=False),
+    )
+
+    assert resumed.final_output == "done"
+    assert state._trace_include_sensitive_data is False
+    function_span = _get_last_function_span_export("send_email")
+    assert function_span["span_data"]["input"] is None
+    assert function_span["span_data"]["output"] is None
+
+
 @pytest.mark.asyncio
 async def test_wrapped_trace_is_single_trace():
     model = FakeModel()
@@ -643,6 +695,49 @@ async def test_resumed_streaming_run_reuses_original_trace_without_duplicate_tra
     assert all(span.trace_id == traces[0].trace_id for span in fetch_ordered_spans())
 
 
+@pytest.mark.asyncio
+async def test_resumed_streaming_run_honors_explicit_trace_include_sensitive_data() -> None:
+    model = FakeModel()
+
+    @function_tool(name_override="send_email", needs_approval=True)
+    def send_email(recipient: str) -> str:
+        return recipient
+
+    agent = Agent(name="trace_agent", model=model, tools=[send_email])
+    model.add_multiple_turn_outputs(
+        [
+            [
+                get_function_tool_call(
+                    "send_email", '{"recipient":"alice@example.com"}', call_id="call-1"
+                )
+            ],
+            [get_text_message("done")],
+        ]
+    )
+
+    first = Runner.run_streamed(agent, input="first_test")
+    async for _ in first.stream_events():
+        pass
+    assert first.interruptions
+
+    state = first.to_state()
+    state.approve(first.interruptions[0], override_arguments={"recipient": "bob@example.com"})
+
+    resumed = Runner.run_streamed(
+        agent,
+        state,
+        run_config=RunConfig(trace_include_sensitive_data=False),
+    )
+    async for _ in resumed.stream_events():
+        pass
+
+    assert resumed.final_output == "done"
+    assert state._trace_include_sensitive_data is False
+    function_span = _get_last_function_span_export("send_email")
+    assert function_span["span_data"]["input"] is None
+    assert function_span["span_data"]["output"] is None
+
+
 @pytest.mark.asyncio
 async def test_wrapped_streaming_trace_is_single_trace():
     model = FakeModel()