Преобразуйте необработанные китайские юридические тексты — законодательные акты или судебные дела — в чистый, структурированный Markdown, удаляя рекламный шум и сохраняя каждое слово по существу.
npx clawhub@latest install legal-text-formatLegal Text Format — это навык форматирования и очистки, специально разработанный для китайских юридических документов. Он принимает необработанный текст нормативных актов (например, Гражданский кодекс, Уголовный закон) или материалы дел (например, модельные дела Верховного суда, судебные решения) и выводит хорошо структурированный Markdown с правильной иерархией заголовков, унифицированной пунктуацией и удалёнными рекламными или нерелевантными материалами.
Навык автоматически обрабатывает два различных типа документов: нормативные правовые акты (структура 章/条 с выделенными жирным шрифтом номерами статей) и судебные дела (название дела, номер дела, фабула, решение и значимость). Каждый результат форматирования архивируется локально вместе с исходными входными данными, предоставляя вам проверяемую запись «до/после».
Важно: Этот навык является исключительно инструментом форматирования — он не загружает содержимое по URL-адресам. Получение веб-страниц или статей из WeChat должно осуществляться специальным навыком загрузки (например, wechat-article-fetch), который может напрямую передавать данные в этот навык.
npx clawhub@latest install legal-text-formatНажмите кнопку Установить вверху страницы для настройки в один клик
wechat-article-fetch) получил юридическую статью из WeChat и должен передать её для форматирования — этот навык принимает путь к файлу напрямую.Навык использует LLM-запрос для классификации входящего текста как законодательного акта или судебного дела перед применением соответствующего набора правил форматирования. Это означает, что вам не нужно указывать тип вручную — Legal Text Format адаптируется автоматически на основе структурных признаков, таких как заголовки глав, номера статей или шаблоны регистрационных номеров дел.
Для уставного текста главы получают заголовки ##, каждая статья (第X条) выделяется жирным шрифтом, между статьями добавляются пустые строки, а все завершающие переносы строк без закрывающего знака препинания удаляются. Всё содержательное содержимое сохраняется дословно — ни один пункт никогда не усекается.
Для документов по делам каждое название дела или порядковый номер оформляется заголовком ##, подразделы (факты, решение, значимость) — заголовками ###, английская пунктуация заменяется китайскими эквивалентами, а цифры приводятся к полуширинному формату. Вводный текст, биографии авторов, нижние колонтитулы, рекламные блоки с QR-кодами и блоки рекомендуемых статей удаляются автоматически.
Каждый запуск сохраняет как необработанный ввод, так и отформатированный вывод в подкаталог с временной меткой внутри archive/. Файлы следуют предсказуемому соглашению об именовании (YYYYMMDD_主題_raw.md / _formatted.md), что упрощает аудит изменений или восстановление исходного текста. Необязательный файл meta.json фиксирует метаданные запуска.
Когда wechat-article-fetch (или другой навык получения данных) обнаруживает юридический контент и данный навык установлен, он может передавать путь к файлу напрямую в качестве входных данных. Навык считывает сохранённый Markdown, запускает полный конвейер форматирования Legal Text Format и записывает результаты в собственный каталог archive/ — без необходимости ручной передачи данных.
Изменения форматирования носят исключительно косметический характер: нормализация пунктуации, уровни заголовков и пробельные символы. Номера дел, названия судов, имена сторон, тексты статей и всё существенное юридическое содержание сохраняются в точности так, как они были получены. Исходный файл всегда сохраняется в качестве эталона.
Пользователь копирует несколько глав 民法典 в чат. Навык Legal Text Format обнаруживает структуру закона, оборачивает каждую главу в ##, выделяет жирным каждую статью 第X条, нормализует пробелы и сохраняет файлы raw.md и formatted.md в папку архива с временной меткой — готовые к импорту в базу знаний.
Юридический исследователь получает статью из WeChat, содержащую 10 модельных дел Верховного суда. Навык Legal Text Format удаляет вводную часть статьи, биографию автора и рекламный контент в конце, затем применяет единую иерархию заголовков ##/### и китайскую пунктуацию ко всем 10 делам, создавая чистый справочный документ.
Студент-юрист регулярно обрабатывает судебные решения для учёбы. Каждый отформатированный файл помещается в собственный архивный каталог с датой и заголовком метаданных, который включает исходный URL (при наличии, предоставленного навыком получения данных), временную метку обработки и тип документа — это делает библиотеку удобной для поиска и цитирования.
При установленном wechat-article-fetch пользователь предоставляет ссылку на публичный аккаунт WeChat. Навык загрузки получает статью и автоматически запускает legal-text-format, который форматирует и архивирует результат без какого-либо дополнительного ввода со стороны пользователя — весь конвейер выполняется в рамках одного запроса.
npx clawhub@latest install legal-text-formatВойдите, чтобы написать отзыв
Отзывов пока нет. Будьте первым, кто поделится своим опытом!