├── LICENSE ├── README.md ├── assets └── framework.png ├── autowebbench ├── en │ ├── ind │ │ └── test.json │ └── ood │ │ └── test.json └── zh │ ├── ind │ └── test.json │ └── ood │ └── test.json ├── eval.py ├── mind2web ├── domain │ └── test.json ├── task │ └── test.json └── website │ └── test.json ├── miniwob++ ├── .gitignore ├── README.md ├── html_tools │ ├── __init__.py │ ├── configs │ │ ├── __init__.py │ │ ├── config.py │ │ └── html_prompt.py │ ├── html_parser.py │ ├── identifier.py │ ├── prompt.py │ └── utils.py ├── install_dependency.sh ├── llms │ ├── __init__.py │ ├── call.py │ └── providers │ │ ├── __init__.py │ │ └── gpt.py ├── main.py ├── miniwob_tools │ ├── __init__.py │ ├── action.py │ ├── configs │ │ ├── __init__.py │ │ ├── config.py │ │ └── prompt.py │ └── utils.py ├── monitor.py ├── requirements.txt └── setup.sh └── webarena ├── .github └── workflows │ ├── pre-commit.yml │ └── tests.yml ├── .gitignore ├── .pre-commit-config.yaml ├── CITATION.cff ├── LICENSE ├── README.md ├── agent ├── __init__.py ├── agent.py └── prompts │ ├── README.md │ ├── __init__.py │ ├── prompt_constructor.py │ ├── raw │ ├── new_action_prompt.py │ ├── p_cot_id_actree_2s.py │ ├── p_cot_id_actree_2s_no_na.py │ ├── p_direct_id_actree_2s.py │ ├── p_direct_id_actree_2s_no_na.py │ ├── p_direct_id_actree_3s_llama.py │ └── test_prompt.py │ └── to_json.py ├── browser_env ├── __init__.py ├── actions.py ├── async_envs.py ├── auto_login.py ├── constants.py ├── env_config.py ├── envs.py ├── helper_functions.py ├── html_tools │ ├── __init__.py │ ├── configs │ │ ├── __init__.py │ │ ├── config.py │ │ └── html_prompt.py │ ├── html_parser.py │ ├── identifier.py │ ├── prompt.py │ └── utils.py ├── processors.py ├── py.typed ├── scripts │ ├── __init__.py │ ├── canva_handler.js │ ├── get_data.js │ ├── get_text.js │ ├── label_marker.js │ ├── local_marker.js │ └── mix_marker.js ├── trajectory.py └── utils.py ├── check_errors.sh ├── config_files ├── examples │ ├── 1.json │ ├── 2.json │ ├── 3.json │ └── 4.json └── test.raw.json ├── environment_docker ├── README.md └── webarena-homepage │ ├── app.py │ ├── static │ └── figures │ │ ├── calculator.png │ │ ├── cms.png │ │ ├── gitlab.png │ │ ├── manual1.png │ │ ├── manual2.png │ │ ├── map.png │ │ ├── onestopshop.png │ │ ├── password.png │ │ ├── reddit.png │ │ ├── scratchpad.png │ │ └── wikipedia.png │ └── templates │ ├── calculator.html │ ├── index.html │ └── scratchpad.html ├── evaluation_harness ├── __init__.py ├── evaluators.py └── helper_functions.py ├── llms ├── __init__.py ├── lm_config.py ├── providers │ ├── hf_utils.py │ ├── openai_utils.py │ └── ours.py ├── tokenizers.py └── utils.py ├── media ├── example_trace_viewer.png ├── homepage_demo.png ├── logo.png ├── overview.png ├── v1_result.png └── v2_result.png ├── minimal_example.py ├── parallel_run.sh ├── prepare.sh ├── requirements.txt ├── resources └── README.md ├── run.py ├── scripts ├── check_error_runs.py ├── collect_obs.py ├── generate_test_data.py ├── html2json.py └── webarena-zeno.ipynb ├── setup.cfg ├── setup.py ├── solver ├── __init__.py ├── shopping_admin.py └── utils.py └── tests ├── conftest.py ├── test_browser_env ├── test_action_functionalities.py ├── test_actions.py ├── test_auth_cookie.py ├── test_playwright_actions.py └── test_script_browser_env.py └── test_evaluation_harness ├── configs ├── func_eval_fail.json ├── func_eval_success.json ├── func_url_func_1.json ├── func_url_func_2.json ├── html_content_element_exact_match.json ├── html_content_exact_match.json ├── html_content_url_comb.json ├── string_match.json └── url_exact_match.json ├── test_evaluators.py └── test_helper_functions.py /README.md: -------------------------------------------------------------------------------- 1 |
Enter the expression and get the results
77 | 78 | 79 | 80 |An admin portal to manage E-commerce business (u: admin, p: admin1234)
88 |