Markus Reuber, доктор медичних наук, професор, Академічне відділення неврології, університет Шеффілда, Королівська лікарня Халламшира, Glossop
Road, Sheffield, S10 2JF
Мій вибір як редактора з поточного випуску журналу «Seizure» - це ретроспективне обсерваційне когортне дослідження Colin B. Josephson (Colin B. Josephson) зі співавторами, метою якого було вивчення клінічних та соціально-економічних особливостей, що впливають на ризик смертності пацієнтів з пізнім початком епілепсії (1). На основі медичних записів понад 1 000 літніх людей з епілепсією та понад 10 000 контрольних осіб (>65 років), відібраних з понад 1 мільйона пацієнтів первинної медичної допомоги, у дослідженні описано десять кластерів ознак, пов'язаних з різними наслідками. Пацієнти з епілепсією були відібрані з бази даних первинної медичної допомоги за допомогою методу, спочатку розробленого для банку даних Secure Anonymised Information Linkage (SAIL) (Уельс, Великобританія), який раніше показав, що виявляє людей з епілепсією з чутливістю 88% і специфічністю 98% (2). Результати дослідження були отримані на основі зв'язку даних первинної медичної допомоги та електронної статистики госпітальних епізодів (HES). Додаткову інформацію про причину смерті було отримано з відповідного Офісу національної статистики Сполученого Королівства (ONS). Для характеристики кластерів був використаний підхід неконтрольованого машинного навчання. Хоча відношення ризиків (ВР) передчасної смерті було підвищено до 1,7 (95% ДІ 1,5-2,0) для осіб з пізнім початком епілепсії, ризик виявився набагато вищим у деяких кластерах, включаючи ті, що були названі «деменція і тривога» (ВР 5. 4; 95% ДІ 3,3-8,7), «пухлина головного мозку» (ВР 5,0; 95% ДІ 2,9-8,6), «внутрішньочерепний крововилив» (ВЧК) та «зловживання алкоголем» (ВР 2,9; 95% ДІ 1,8-4,8) та «ішемічний інсульт» (ВР 2,83; 95% ДІ 1,8-4,0). Причини смерті, пов'язані з нападами, були рідкісними і обмежувалися кластерами «ІХС», «ІХС та зловживання алкоголем» і «здорові жінки».
Це дослідження є гарним прикладом дослідницького підходу, який останніми роками все частіше використовується, чому сприяють пов'язані між собою
електронні бази даних і досягнення в галузі машинного навчання. Цей підхід до «великих даних» викликав дискусію, яка знайшла своє відображення у двох інших публікаціях поточного випуску «Напад»: Редакційна стаття Randi van Wrede та ін. (3) і відповідь Julie W. Dreier (4). Randi van Wrede та ін. вказують на те, що дослідження «big data» часто роблять широкі висновки без достатнього врахування внутрішньо-індивідуальної варіативності. Вони стверджують, що деякі дослідження «big data» в галузі епілепсії не розрізняють епілепсію як причину, наслідок або асоціацію з супутніми захворюваннями або іншими відповідними патологічними знахідками.
Крім того, вони підкреслюють ризик спрощених заголовків і вторинних звітів, що сприяють неправильному розумінню епілепсії - навіть якщо обмеження
оригінальної роботи були обговорені авторами в первинній публікації (3). На противагу цьому, Dreier et al. вказують на великий потенціал і досягнення
досліджень «big data». Вони посилаються на готову доступність даних, що забезпечує економічно ефективне використання обмежених дослідницьких фондів, а також на великий розмір когорт, що дозволяє включити мільйони суб'єктів і вивчити рідкісні експозиції або результати. Серед інших переваг підходу «big-data» вони називають зменшення упередженості відбору, доступність лонгітюдинальих даних, що дозволяє дослідникам вивчати довгострокові ефекти, а також усунення упередженості пригадування за допомогою проспективного збору даних. Вони нагадують читачам про підтвердження тератогенного впливу вальпроатів як про важливе відкриття, зроблене на основі досліджень «big-data». Рубрика «Вибір редактора» дає читачам можливість скласти власну думку: Чи є кластери ознак, які ідентифікують деяких пацієнтів як таких, що мають особливо високий ризик передчасної смерті, клінічно корисними? Чи можуть вони спонукати клініцистів зосередити свою увагу на групах пацієнтів з особливим ризиком - наприклад, на «здорових жінках»? - Або ж діагнози на основі «big data» настільки ч асто помилкові, а ознаки настільки розпливчасті, що аналіз Colin B. Josephson та ін., швидше за все, сприятиме необґрунтованому занепокоєнню і марному витрачанню ресурсів?
Література
(1) Josephson CB, Gonzalez-Izquierdo A, Engbers JDT, Denaxas S, Delgado-Garcia G, Sajobi TT, Wang M, Keezer MR, Wiebe S. Association of comorbid-socioeconomic clusters with mortality in late onset epilepsy derived through unsupervised machine learning. Seizure 2023, 111:58-67.
(2) Fonferko-Shadrach B, Lacey AS, White CP, Powell HWR, Sawhney IMS, Lyons RA, et al. Validating epilepsy diagnoses in routinely collected data. Seizure 2017;52:195–8.
(3) von Wrede R, Witt JA, Helmstaedter C. Big Data - Big Trouble: The two faces of publishing results from big data studies based on cohorts with poor clinical
definition. Seizure 2023;111:21-22.
(4) Dreier JW, Bjørk M-H, Alvestad S, Gissler M, Igland J, Leinonen MK, Sun Y, Zoega H, Cohen JM, Furu K, Tomson T, Christencen J. Why Big Data Carries Big Potential Rather Than Big Trouble. Seizure 2023;111:106-108.