Descargo de responsabilidad: Soy el autor de WebScrapbook y ScrapBook X.

WebScrapbook

WebScrapbook es el sucesor de ScrapBook X, que es un complemento de Firefox heredado que ha implementado muchas mejoras sobre el álbum de recortes heredado.

Debido a la limitación del marco WebExtension, algunas características como organizar páginas capturadas, resaltar y tomar notas requieren un servidor backend colaborador, que se puede configurar utilizando PyWebScrapBook. PyWebScrapBook es rico en funciones y ha implementado la mayoría de las funciones esenciales para el alojamiento remoto, como SSL, autorización HTTP, protección CSRF, soporte de proxy inverso y puede alojar varios álbumes de recortes en una sola aplicación de servidor.

Los recortes del álbum de recortes heredado se pueden importar a WebScrapbook. Sin embargo, las páginas nuevas capturadas de WebScrapbook no se pueden usar directamente en el álbum de recortes heredado.

WebScrapbook también implementó varias mejoras, como un mejor soporte para múltiples álbumes de recortes, y soporte para archivos MAFF, etc. Un breve resumen está disponible aquí.

El objetivo principal de WebScrapbook es ser una herramienta de captura y toma de notas de páginas web multiplataforma, remota y móvil, fiel, flexible y reutilizable. Puedes visitar la wiki de documentación para un inicio rápido.

Portar un álbum de recortes a WebExtension es un trabajo muy grande. El desarrollo de WebScrapbook ha sido de 3 años y todavía hay muchas características de Bloc de notas heredadas que aún no se han implementado. Pero ya hemos implementado la mayoría de las características clave, así como muchas mejoras, y todavía estamos en proceso.

Aquí hay una revisión de varias herramientas similares, y mis comentarios personales sobre ellas:

SingleFile

SingleFile es una extensión de navegador multiplataforma para captura de páginas web. La diferencia clave con WebScrapbook es que captura una página web en un solo archivo HTML en lugar de una carpeta de archivos. La fidelidad de una página capturada es muy buena y comparable con Webcrapbook (hay casos de margen en los que funciona mejor y peor que Webcrapbook, respectivamente). SingleFile opcionalmente puede agregar resaltados y anotaciones antes de una captura.

SingleFile también implementa muchas funciones buenas, como captura automática, compatibilidad con múltiples perfiles y configuraciones de captura específicas del sitio, y guardar los datos capturados en Google Drive, etc.

WebScrapbook también admite guardar la página en un solo archivo HTML, pero no principalmente, debido a sus limitaciones por naturaleza:

  1. Tiende a ser de mayor tamaño y carga más lenta debido a la naturaleza del URI de datos.
  2. No puede preservar cierta estructura de datos complicada, y es casi imposible almacenar varias páginas en un solo HTML (por ejemplo, captura en profundidad de álbumes de recortes heredados).
  3. Los recursos guardados no se pueden extraer y reutilizar fácilmente, ya que están incrustados en el archivo HTML.

Para eso, SingleFile ha implementado muchas técnicas modernas de lujo para reducir el tamaño de la página, y, como resultado, la página original puede ser ligeramente alterada. Además, una página web capturada por un solo archivo puede estar rota en gran medida en un navegador antiguo, incluso si funciona bien con la versión original.

Además, SingleFile no implementa un mecanismo para buscar y organizar páginas capturadas, y las páginas capturadas no se pueden editar ni guardar de nuevo.

Guardar página WE

Guardar página WE también es una extensión de navegador multiplataforma que guarda la página web en un solo archivo HTML. Proporciona una buena revisión de todos los recursos guardados, de lo contrario, la mayoría de sus características generalmente están cubiertas por un solo archivo. Además, su repositorio de código fuente no está abierto.

Maoxian Web Clipper

MaoXian Web Clipper es también una herramienta de captura de páginas web multiplataforma. Captura páginas web en archivos estructuralmente, de una manera muy diferente a la del álbum de recortes heredado, en la carpeta de descarga. También proporciona un mecanismo para revisarlos a través del historial de descargas, y opcionalmente puede combinar el historial con la ayuda de una aplicación asistente.

Parece centrarse más en recortar parte de una página que en guardar una página entera. También admite guardar una página web en formato markdown.

Sin embargo, no es compatible con la organización de páginas, el resaltado y la anotación de páginas, la búsqueda de texto completo y el acceso remoto.

ScrapBee

ScrapBee es un complemento para Firefox que tiene como objetivo admitir el acceso a datos de álbumes de recortes heredados. ScrapBee y viceversa pueden acceder a una carpeta de álbumes de recortes heredada. Requiere la instalación de una aplicación de servidor nativa colaboradora para funcionar. Se implementan funciones como la captura de páginas web, la organización de páginas, el resaltado y la anotación de páginas y la búsqueda de texto completo.

Sin embargo, hay contras:

  1. Firefox solo para escritorio y sin soporte multiplataforma.
  2. El servidor backend colaborador es solo local y aún no está listo para el alojamiento remoto.
  3. La funcionalidad de captura es bastante básica. Muchas páginas simplemente no se pueden capturar fielmente.
  4. No es de código abierto. En el momento de escribir este artículo, su repositorio de fuentes no está actualizado en sincronización con el complemento de Firefox publicado. Por lo tanto, el código fuente de la última versión de su aplicación de backend local no es público y la seguridad no está confirmada.

ScrapYard

ScrapYard es un complemento de Firefox que captura una página web en el almacenamiento local del navegador. También proporciona integración de marcadores.

Para un enfoque solo de extensión de navegador, ScrapYard es probablemente el que más se asemeja al álbum de recortes heredado en la vista de captura, organización y toma de notas de páginas.

Su código se basa en ScrapBee y su funcionalidad de captura es igualmente limitada.

Tenga en cuenta, sin embargo, el almacenamiento del navegador local es bastante diferente del sistema de archivos. Hay muchas limitaciones para el almacenamiento del navegador, y su seguridad y confiabilidad aún esperan por probarse. Asegúrese de confirmar su funcionalidad de exportación / importación antes de usarla en producción.