Convierte textos legales chinos sin procesar — estatutos o casos judiciales — en Markdown limpio y estructurado, eliminando el ruido promocional mientras se preserva cada palabra de contenido relevante.
npx clawhub@latest install legal-text-formatLegal Text Format es una habilidad de formateo y limpieza diseñada específicamente para documentos legales en chino. Acepta texto legislativo sin procesar (por ejemplo, Código Civil, Derecho Penal) o documentos de casos (por ejemplo, casos modelo del Tribunal Supremo, resoluciones judiciales) y genera Markdown bien estructurado con una jerarquía de encabezados correcta, puntuación unificada y todo el contenido promocional o irrelevante eliminado.
La habilidad gestiona automáticamente dos tipos de documentos diferenciados: estatutos legales (estructura 章/条 con números de artículo en negrita) y casos legales (título del caso, número de expediente, hechos, fallo y relevancia). Cada resultado de formateo se archiva localmente junto con la entrada original, lo que proporciona un registro verificable antes/después.
Importante: Esta habilidad es únicamente un formateador — no recupera contenido de URLs. La obtención de artículos web o de WeChat debe gestionarse mediante una habilidad de recuperación dedicada (por ejemplo, wechat-article-fetch), que puede encadenarse directamente con esta habilidad.
npx clawhub@latest install legal-text-formatHaz clic en el botón Instalar en la parte superior de esta página para una configuración rápida
wechat-article-fetch) ha recuperado un artículo legal de WeChat y necesita entregarlo para su formateo — esta habilidad acepta esa ruta de archivo directamente.La skill utiliza un prompt de LLM para clasificar el texto entrante como un estatuto legal o un caso legal antes de aplicar el conjunto de reglas de formato correspondiente. Esto significa que no es necesario especificar el tipo — la skill se adapta automáticamente en función de señales estructurales como encabezados de capítulo, números de artículo o patrones de expedientes judiciales.
Para texto estatutario, los capítulos reciben encabezados ##, cada artículo (第X条) aparece en negrita, se añaden líneas en blanco entre artículos y se eliminan los saltos de línea al final que no tengan signo de puntuación de cierre. Todo el contenido sustantivo se conserva literalmente — ninguna cláusula es truncada en ningún momento.
Para los documentos de casos, cada título de caso o número de secuencia recibe un encabezado ##, las subsecciones (hechos, resolución, relevancia) reciben encabezados ###, la puntuación en inglés se reemplaza por sus equivalentes en chino, y los números se normalizan a ancho medio. El texto introductorio, las biografías de autores, los pies de página, las promociones con códigos QR y los bloques de artículos recomendados se eliminan automáticamente.
Cada ejecución guarda tanto la entrada sin procesar como la salida formateada en un subdirectorio con marca de tiempo dentro de archive/. Los archivos siguen una convención de nomenclatura predecible (YYYYMMDD_主题_raw.md / _formatted.md), lo que facilita auditar cambios o recuperar el texto original. Un archivo opcional meta.json captura los metadatos de la ejecución.
Cuando wechat-article-fetch (u otra habilidad de obtención) detecta contenido legal y esta habilidad está instalada, puede pasar una ruta de archivo directamente como entrada. La habilidad lee el Markdown guardado, ejecuta el flujo completo de Legal Text Format y escribe los resultados en su propio directorio archive/ — sin necesidad de transferencia manual.
Los cambios de formato son estrictamente cosméticos: normalización de puntuación, niveles de encabezado y espaciado. Los números de caso, nombres de tribunales, nombres de las partes, texto de artículos y todo el contenido legal sustantivo se conservan exactamente tal como se recibieron. El archivo original siempre se mantiene como referencia.
Un usuario copia varios capítulos de la 民法典 en el chat. La habilidad Legal Text Format detecta la estructura normativa, envuelve cada capítulo en ##, pone en negrita cada 第X条, normaliza el espaciado y guarda raw.md junto con formatted.md en una carpeta de archivo con marca de tiempo, listos para importar en una base de conocimiento.
Un investigador jurídico obtiene un artículo de WeChat que contiene 10 casos modelo del Tribunal Supremo. La habilidad Legal Text Format elimina la introducción del artículo, la biografía del autor y el contenido promocional al final, luego aplica una jerarquía de encabezados ##/### coherente y puntuación china normalizada en los 10 casos, generando un documento de referencia limpio.
Un estudiante de derecho procesa regularmente resoluciones judiciales para su estudio. Cada archivo formateado con Legal Text Format se almacena en su propio directorio de archivo con fecha, acompañado de un encabezado de metadatos que incluye la URL de origen (cuando la proporciona una skill de obtención de contenido), la marca de tiempo del procesamiento y el tipo de documento, lo que facilita la búsqueda y la cita dentro de la biblioteca.
Con wechat-article-fetch instalado, el usuario proporciona un enlace de cuenta pública de WeChat. La skill de recuperación obtiene el artículo y activa automáticamente legal-text-format, que formatea y archiva el resultado sin ninguna intervención adicional del usuario: todo el pipeline se ejecuta como una única solicitud.
npx clawhub@latest install legal-text-formatInicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!