ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 2.1 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | FAIL | meta_canonical IS NULL OR = '' OR = src_unparsed | ru,kommersant!www,/doc/8007387 s443 |
| Property | Value | ||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.kommersant.ru/doc/8038668 | ||||||||||||||||||||||||||||||
| Last Crawled | 2026-04-02 23:03:50 (2 months ago) | ||||||||||||||||||||||||||||||
| First Indexed | 2025-09-13 07:11:50 (8 months ago) | ||||||||||||||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||||||||||||||
| Content | |||||||||||||||||||||||||||||||
| Meta Title | Трамп потребовал раскрыть данные об эффективности препаратов от COVID-19 – Коммерсантъ | ||||||||||||||||||||||||||||||
| Meta Description | Президент США заявил о необходимости прозрачности со стороны фармкомпаний | ||||||||||||||||||||||||||||||
| Meta Canonical | ru,kommersant!www,/doc/8007387 s443 | ||||||||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||||||||
| ML Classification | |||||||||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/Health": 558,
"/News": 538,
"/Health/Pharmacy": 310,
"/Health/Pharmacy/Drugs_and_Medications": 309,
"/Finance": 293,
"/News/Health_News": 276,
"/Finance/Investing": 249,
"/Finance/Investing/Stocks_and_Bonds": 190,
"/Law_and_Government": 163,
"/Law_and_Government/Government": 107
} | ||||||||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 943,
"/Article/News_Update": 930
} | ||||||||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 999
} | ||||||||||||||||||||||||||||||
| Content Metadata | |||||||||||||||||||||||||||||||
| Language | ru | ||||||||||||||||||||||||||||||
| Author | null | ||||||||||||||||||||||||||||||
| Publish Time | 2025-09-12 13:09:01 (8 months ago) | ||||||||||||||||||||||||||||||
| Original Publish Time | 2025-09-12 13:09:01 (8 months ago) | ||||||||||||||||||||||||||||||
| Republished | No | ||||||||||||||||||||||||||||||
| Word Count (Total) | 7,652 | ||||||||||||||||||||||||||||||
| Word Count (Content) | 1,667 | ||||||||||||||||||||||||||||||
| Links | |||||||||||||||||||||||||||||||
| External Links | 0 | ||||||||||||||||||||||||||||||
| Internal Links | 1 | ||||||||||||||||||||||||||||||
| Technical SEO | |||||||||||||||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||||||||||||||
| Meta Noarchive | Yes | ||||||||||||||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||||||||||||||
| Performance | |||||||||||||||||||||||||||||||
| Download Time (ms) | 644 | ||||||||||||||||||||||||||||||
| TTFB (ms) | 539 | ||||||||||||||||||||||||||||||
| Download Size (bytes) | 24,668 | ||||||||||||||||||||||||||||||
| Location | |||||||||||||||||||||||||||||||
| Host ID | 111 (laksa111) | ||||||||||||||||||||||||||||||
| Partition ID | 68 | ||||||||||||||||||||||||||||||
| Root Hash | 1761839161268513711 | ||||||||||||||||||||||||||||||
| Unparsed URL | ru,kommersant!www,/doc/8038668 s443 | ||||||||||||||||||||||||||||||