Disclaimer: jag är författare till WebScrapBook och ScrapBook X.

WebScrapBook

WebScrapBook är efterföljaren till ScrapBook X, vilket är en äldre Firefox add-on som har genomfört massor av förbättringar jämfört med äldre ScrapBook.

på grund av begränsningen av WebExtension framework kräver vissa funktioner som att organisera fångade sidor, markera och ta anteckningar en samarbetande backend-server, som kan ställas in med PyWebScrapBook. PyWebScrapBook är funktionsrik och har implementerat de viktigaste funktionerna för fjärrhosting, till exempel SSL, HTTP-auktorisering, CSRF-skydd, omvänd proxystöd och kan vara värd för flera klippböcker i en enda serverapp.

klipp från äldre klippbok kan importeras till WebScrapBook. Nya sidor som tagits från WebScrapBook kan dock inte användas direkt i äldre klippbok.

WebScrapBook implementerade också flera förbättringar, till exempel bättre stöd för flera klippböcker och MAFF-arkivstöd etc. En snabb sammanfattning finns här.

huvudmålet med WebScrapBook är att vara ett plattformsoberoende, fjärr-och mobilåtkomligt, troget, flexibelt och återanvändbart verktyg för att fånga och notera webbsidor. Du kan besöka dokumentationswiki för en snabb start.

Porting ScrapBook till WebExtension är ett mycket stort arbete. Utvecklingen av WebScrapBook har varit 3 år och det finns fortfarande många funktioner i legacy ScrapBook som ännu inte genomförts. Men vi har redan genomfört de flesta viktiga funktioner samt många förbättringar, och fortsätter fortfarande.

här är en översyn av flera liknande verktyg, och mina personliga kommentarer om dem:

SingleFile

SingleFile är en plattformsoberoende webbläsartillägg för webbsida capture. Huvudskillnaden från WebScrapBook är att den fångar en webbsida i en enda HTML-fil snarare än en mapp med filer. Troheten hos en fångad sida är mycket bra och jämförbar med WebScrapBook (det finns marginalfall att det fungerar bättre än respektive sämre än WebScrapBook). SingleFile kan valfritt lägga till höjdpunkter och anteckningar innan en fångst.

SingleFile implementerar också många bra funktioner som auto capture, multi-profil support och platsspecifika capture configs, och spara fångade data till Google Drive, etc.

WebScrapBook stöder också spara sida i en enda HTML-fil, men inte i första hand, på grund av dess begränsningar av naturen:

  1. det tenderar att vara större i storlek och laddas långsammare på grund av data-URI: s natur.
  2. det kan inte bevara vissa komplicerade datastruktur, och det är nästan omöjligt att lagra flera sidor i en enda HTML (t.ex. djupgående fångst av äldre klippbok).
  3. sparade resurser kan inte enkelt extraheras och återanvändas eftersom de är inbäddade i HTML-filen.

för det har SingleFile implementerat många fina moderna tekniker för att minska sidstorleken, och som ett resultat kan den ursprungliga sidan ändras något. Dessutom kan en webbsida som fångats av SingleFile till stor del brytas i en äldre webbläsare, även om den fungerar bra med originalversionen.

dessutom implementerar SingleFile inte en mekanism för att söka och organisera fångade sidor, och fångade sidor kan inte redigeras och sparas igen.

Spara sida vi

Spara sida Vi är också en plattformsoberoende webbläsartillägg som sparar webbsida i en enda HTML-fil. Det ger en fin genomgång av alla sparade resurser, annars de flesta av dess funktioner i allmänhet omfattas av SingleFile. Dessutom är dess källkodsförvar inte öppet.

MaoXian Web Clipper

MaoXian Web Clipper är också en plattformsoberoende webbsida fånga verktyg. Den fångar webbsidor i filer strukturellt, på ett helt annat sätt än äldre klippbok, i nedladdningsmappen. Det ger också en mekanism för att granska dem via nedladdningshistoriken och kan eventuellt slå samman historiken med hjälp av en assistentapp.

det verkar fokusera mer på att klippa en del av en sida än att spara en hel sida. Det stöder också att spara en webbsida i wiki-format.

det finns inget stöd för sidorganisation, sidmarkering och annotering, fulltextsökning och fjärråtkomst.

ScrapBee

ScrapBee är ett Firefox-tillägg som syftar till att stödja åtkomst till äldre Klippbokdata. En äldre Klippbokmapp kan nås av ScrapBee och vice versa. Det kräver installation av en samarbetande inbyggd serverapp för att fungera. Funktioner som webbsida fånga, sida organisera, sida markera och annotering, och fulltext sökning genomförs.

det finns nackdelar, dock:

  1. endast Firefox-skrivbordet och inget plattformsstöd.
  2. den samarbetande backend-servern är endast lokal och är inte redo för fjärrhosting än.
  3. Capture funktionalitet är ganska grundläggande. Många sidor kan bara inte fångas troget.
  4. icke – öppen källkod. I skrivande stund uppdateras dess källförvar inte synkroniserat med det publicerade Firefox-tillägget. Källkoden för den senaste versionen av dess lokala backend-applikation är därför icke-offentlig och säkerhet obekräftad.

ScrapYard

ScrapYard är ett Firefox-tillägg som fångar en webbsida i lokal webbläsarlagring. Det ger också bokmärkesintegration.

för en webbläsarförlängningsmetod är ScrapYard förmodligen den som mest liknar äldre klippbok i vyn för att fånga, organisera och notera.

dess kod är baserad på ScrapBee och dess fångstfunktionalitet är på samma sätt begränsad.

Observera dock att lokal webbläsarlagring är helt annorlunda än filsystem. Det finns många begränsningar för webbläsarlagring, och dess säkerhet och tillförlitlighet väntar fortfarande på bevisa. Var noga med att bekräfta dess export/import funktionalitet innan du använder den i produktionen.