ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 1.3 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.medrxiv.org/content/10.1101/2020.04.26.20080911v4 | ||||||||||||||||||
| Last Crawled | 2026-04-24 23:54:41 (1 month ago) | ||||||||||||||||||
| First Indexed | 2020-09-29 08:18:34 (5 years ago) | ||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||
| Content | |||||||||||||||||||
| Meta Title | Diagnosing SARS-CoV-2 infection: the danger of over-reliance on positive test results | medRxiv | ||||||||||||||||||
| Meta Description | medRxiv - the preprint server for biology, operated by openRxiv, a nonprofit organization dedicated to advancing scientific communication | ||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||
| ML Classification | |||||||||||||||||||
| ML Categories |
Raw JSON{
"/Health": 857,
"/Science": 686,
"/Science/Biological_Sciences": 674,
"/Health/Public_Health": 590,
"/Health/Public_Health/Health_Policy": 542,
"/Science/Biological_Sciences/Other": 462
} | ||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 926,
"/Article/Study_or_Research_Findings": 887
} | ||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 999
} | ||||||||||||||||||
| Content Metadata | |||||||||||||||||||
| Language | en | ||||||||||||||||||
| Author | null | ||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||
| Original Publish Time | 2008-09-11 00:00:00 (17 years ago) | ||||||||||||||||||
| Republished | No | ||||||||||||||||||
| Word Count (Total) | 1,118 | ||||||||||||||||||
| Word Count (Content) | 487 | ||||||||||||||||||
| Links | |||||||||||||||||||
| External Links | 17 | ||||||||||||||||||
| Internal Links | 101 | ||||||||||||||||||
| Technical SEO | |||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||
| Meta Noarchive | No | ||||||||||||||||||
| JS Rendered | No | ||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||
| Performance | |||||||||||||||||||
| Download Time (ms) | 1,989 | ||||||||||||||||||
| TTFB (ms) | 1,987 | ||||||||||||||||||
| Download Size (bytes) | 25,286 | ||||||||||||||||||
| Location | |||||||||||||||||||
| Host ID | 96 (laksa096) | ||||||||||||||||||
| Partition ID | 98 | ||||||||||||||||||
| Root Hash | 14490206815572379696 | ||||||||||||||||||
| Unparsed URL | org,medrxiv!www,/content/10.1101/2020.04.26.20080911v4 s443 | ||||||||||||||||||