ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | FAIL | download_stamp > now() - 6 MONTH | 9.4 months ago |
| History drop | FAIL | isNull(history_drop_reason) | tooold |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://pmc.ncbi.nlm.nih.gov/articles/PMC7610170/ | ||||||||||||||||||
| Last Crawled | 2025-08-26 10:38:28 (9 months ago) | ||||||||||||||||||
| First Indexed | not set | ||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||
| Content | |||||||||||||||||||
| Meta Title | CatBoost for big data: an interdisciplinary review - PMC | ||||||||||||||||||
| Meta Description | Gradient Boosted Decision Trees (GBDT’s) are a powerful tool for classification and regression tasks in Big Data. Researchers should be familiar with the strengths and weaknesses of current implementations of GBDT’s in order to use them effectively ... | ||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||
| ML Classification | |||||||||||||||||||
| ML Categories |
Raw JSON{
"/Science": 651,
"/Science/Computer_Science": 621,
"/Science/Computer_Science/Machine_Learning_and_Artificial_Intelligence": 598,
"/Computers_and_Electronics": 570,
"/Computers_and_Electronics/Software": 551,
"/Computers_and_Electronics/Software/Software_Utilities": 252
} | ||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 958,
"/Article/Study_or_Research_Findings": 765
} | ||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 999
} | ||||||||||||||||||
| Content Metadata | |||||||||||||||||||
| Language | en | ||||||||||||||||||
| Author | null | ||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||
| Original Publish Time | 2025-08-26 10:38:28 (9 months ago) | ||||||||||||||||||
| Republished | No | ||||||||||||||||||
| Word Count (Total) | 25,401 | ||||||||||||||||||
| Word Count (Content) | 14,150 | ||||||||||||||||||
| Links | |||||||||||||||||||
| External Links | 238 | ||||||||||||||||||
| Internal Links | 89 | ||||||||||||||||||
| Technical SEO | |||||||||||||||||||
| Meta Nofollow | Yes | ||||||||||||||||||
| Meta Noarchive | Yes | ||||||||||||||||||
| JS Rendered | No | ||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||
| Performance | |||||||||||||||||||
| Download Time (ms) | 170 | ||||||||||||||||||
| TTFB (ms) | 163 | ||||||||||||||||||
| Download Size (bytes) | 108,166 | ||||||||||||||||||
| Location | |||||||||||||||||||
| Host ID | 129 (laksa129) | ||||||||||||||||||
| Partition ID | 63 | ||||||||||||||||||
| Root Hash | 7295144728021232729 | ||||||||||||||||||
| Unparsed URL | gov,nih!nlm,ncbi,pmc,/articles/PMC7610170/ s443 | ||||||||||||||||||