ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.1 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.cnn.com/2022/05/11/politics/trump-hotel-washington-dc-lease-sold | ||||||||||||||||||||||||
| Last Crawled | 2026-05-31 02:28:05 (3 days ago) | ||||||||||||||||||||||||
| First Indexed | 2025-05-01 13:45:02 (1 year ago) | ||||||||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||||||||
| Content | |||||||||||||||||||||||||
| Meta Title | Trump sells Washington hotel lease to investment group | CNN Politics | ||||||||||||||||||||||||
| Meta Description | Former President Donald Trump has officially checked out of the Washington, DC, hotel business. | ||||||||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| ML Classification | |||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/News": 636,
"/News/Politics": 472,
"/News/Politics/Campaigns_and_Elections": 344,
"/Law_and_Government": 282,
"/Law_and_Government/Government": 212,
"/Law_and_Government/Government/Executive_Branch": 148,
"/Real_Estate": 144,
"/Business_and_Industrial": 132
} | ||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 995,
"/Article/News_Update": 995
} | ||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 985
} | ||||||||||||||||||||||||
| Content Metadata | |||||||||||||||||||||||||
| Language | en | ||||||||||||||||||||||||
| Author | Paul LeBlanc | ||||||||||||||||||||||||
| Publish Time | 2022-05-12 00:35:26 (4 years ago) | ||||||||||||||||||||||||
| Original Publish Time | 2022-05-11 00:00:00 (4 years ago) | ||||||||||||||||||||||||
| Republished | No | ||||||||||||||||||||||||
| Word Count (Total) | 1,336 | ||||||||||||||||||||||||
| Word Count (Content) | 372 | ||||||||||||||||||||||||
| Links | |||||||||||||||||||||||||
| External Links | 13 | ||||||||||||||||||||||||
| Internal Links | 259 | ||||||||||||||||||||||||
| Technical SEO | |||||||||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||||||||
| Meta Noarchive | No | ||||||||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||||||||
| Performance | |||||||||||||||||||||||||
| Download Time (ms) | 1,612 | ||||||||||||||||||||||||
| TTFB (ms) | 901 | ||||||||||||||||||||||||
| Download Size (bytes) | 515,453 | ||||||||||||||||||||||||
| Location | |||||||||||||||||||||||||
| Host ID | 51 (laksa051) | ||||||||||||||||||||||||
| Partition ID | 20 | ||||||||||||||||||||||||
| Root Hash | 2312100192101524051 | ||||||||||||||||||||||||
| Unparsed URL | com,cnn!www,/2022/05/11/politics/trump-hotel-washington-dc-lease-sold s443 | ||||||||||||||||||||||||