browsertrix

History

Ilya Kreymer 00eb62214d Uploads API: BaseCrawl refactor + Initial support for /uploads endpoint (#937 ) * basecrawl refactor: make crawls db more generic, supporting different types of 'base crawls': crawls, uploads, manual archives - move shared functionality to basecrawl.py - create a base BaseCrawl object, which contains start / finish time, metadata and files array - create BaseCrawlOps, base class for CrawlOps, which supports base crawl deletion, querying and collection add/remove * uploads api: (part of #929) - new UploadCrawl object which extends BaseCrawl, has name and description - support multipart form data data upload to /uploads/formdata - support streaming upload of a single file via /uploads/stream, using botocore multipart upload to upload to s3-endpoint in parts - require 'filename' param to set upload filename for streaming uploads (otherwise use form data names) - sanitize filename, place uploads in /uploads/<uuid>/<sanitized-filename>-<random>.wacz - uploads have internal id 'upload-<uuid>' - create UploadedCrawl object with CrawlFiles pointing to the newly uploaded files, set state to 'complete' - handle upload failures, abort multipart upload - ensure uploads added within org bucket path - return id / added when adding new UploadedCrawl - support listing, deleting, and patch /uploads - support upload details via /replay.json to support for replay - add support for 'replaceId=<id>', which would remove all previous files in upload after new upload succeeds. if replaceId doesn't exist, create new upload. (only for stream endpoint so far). - support patching upload metadata: notes, tags and name on uploads (UpdateUpload extends UpdateCrawl and adds 'name') * base crawls api: Add /all-crawls list and delete endpoints for all crawl types (without resources) - support all-crawls/<id>/replay.json with resources - Use ListCrawlOut model for /all-crawls list endpoint - Extend BaseCrawlOut from ListCrawlOut, add type - use 'type: crawl' for crawls and 'type: upload' for uploads - migration: ensure all previous crawl objects / missing type are set to 'type: crawl' - indexes: add db indices on 'type' field and with 'type' field and oid, cid, finished, state * tests: add test for multipart and streaming upload, listing uploads, deleting upload - add sample WACZ for upload testing: 'example.wacz' and 'example-2.wacz' * collections: support adding and remove both crawls and uploads via base crawl - include collection_ids in /all-crawls list - collections replay.json can include both crawls and uploads bump version to 1.6.0-beta.2 --------- Co-authored-by: Tessa Walsh <tessa@bitarchivist.net>		2023-07-07 09:13:26 -07:00
..
admin/logging	Add lightweight logging mode (#668 )	2023-03-10 14:34:37 -08:00
btrix-crds	stopping fix: backend fixes for #836 + prep for additional status fields (#837 )	2023-05-08 14:02:20 -07:00
charts	stopping fix: backend fixes for #836 + prep for additional status fields (#837 )	2023-05-08 14:02:20 -07:00
examples	ansible: rocky firewall (#635 )	2023-02-24 17:28:21 -08:00
templates	Uploads API: BaseCrawl refactor + Initial support for /uploads endpoint (#937 )	2023-07-07 09:13:26 -07:00
test	tests: fixes for crawl cancel + crawl stopped (#864 )	2023-05-22 20:17:29 -07:00
.helmignore
Chart.lock	Refactor to use new operator on backend (#789 )	2023-04-24 18:30:52 -07:00
Chart.yaml	Refactor to use new operator on backend (#789 )	2023-04-24 18:30:52 -07:00
README.md	Refactor to use new operator on backend (#789 )	2023-04-24 18:30:52 -07:00
values.yaml	config: add overridable 'user_agent_suffix' and 'user_agent' to values.yaml, (#910 )	2023-06-07 12:01:12 -07:00

README.md

Update Helm dependencies

It needs to update Helm charts after changing its dependencies (e.g. logging)

$ helm dependency update .

Update metacontroller

#!/bin/bash

# intall metacontroller
git clone --depth=1 https://github.com/metacontroller/metacontroller.git
cd metacontroller
helm package deploy/helm/metacontroller --destination deploy/helm
cd ..

# update dependency
helm dependency update

Bump up the metacontroller version in Chart.yaml