Keputusan Carian dan Pemilihan Kajian
Mengikut Panduan Pelaporan Pilihan (PRISMA) 2020 [38], Rajah 1 menunjukkan carta aliran untuk menyaring literatur. Pada awalnya, sebanyak 5722 artikel ditemui melalui pelbagai pangkalan data, setelah membuang 1257 artikel duplikat, 4465 artikel telah disaring. Melalui pembacaan tajuk dan abstrak, hanya tinggal 71 artikel. Namun, selepas membaca teks penuh, 55 kajian terpaksa disingkirkan dengan sebab yang berbeza: 26 kajian tidak membangunkan model ramalan, 14 tidak melibatkan warga emas berumur 60 tahun ke atas, empat kajian tiada ukuran hasil untuk ketidakupayaan, sepuluh kajian kohort mempunyai peserta yang sudah mengalami ketidakupayaan pada permulaan, dan satu kajian bukan merupakan kajian observasi. Akhirnya, sebanyak 16 kajian dipilih untuk ulasan sistematik ini.
Ciri-ciri Kajian
Ciri Umum
Ciri umum kajian yang dimasukkan ditunjukkan dalam Jadual 1. Kajian-kajian ini diterbitkan antara tahun 2012 hingga 2023, dengan sembilan kajian [13, 14, 20, 22, 24, 25, 26, 27, 28] dari China, tiga kajian [15, 18, 19] dari Amerika Syarikat, tiga kajian [17, 21, 23] dari Jepun, serta satu kajian [16] dari Jerman, United Kingdom, Itali dan Belanda. Dari segi reka bentuk, sembilan kajian [15, 16, 18, 19, 21, 23, 24, 25, 26] bersifat kohort retrospektif, dua kajian [17, 28] kohort prospektif, dan lima kajian [13, 14, 20, 22, 27] bersifat potong. Kebanyakan kajian ini menggunakan data skala besar, ada yang menggunakan data multi-pusat, dan yang lain hanya dari satu pusat hospital. Dari aspek jenis model, terdapat 11 model ramalan prognosis dan 6 model ramalan diagnostik. Fokus kajian berbeza dengan 7 kajian mengkaji warga emas berumur 60 ke atas, sementara 5 kajian lainnya mengambil kira yang berumur 65 ke atas.
Butiran Model Ramalan
Butiran model-model ramalan ditunjukkan dalam Jadual 2. Setiap kali kajian membangunkan lebih satu model, hanya model dengan prestasi ramalan terbaik diambil kira. Namun, model yang berbeza sesuai untuk sub-kumpulan tertentu tetap dimasukkan. Misalnya, Shao dan Wu [22] mengembangkan model ramalan secara berasingan untuk warga emas di kawasan bandar dan luar bandar, jadi kita akhirnya menambah 17 model ramalan ke dalam kajian ini.
-
a)
Kaedah pembangunan model
Sepuluh model [13, 15, 16, 21, 22, 24, 25, 26, 27] dibangunkan menggunakan analisis regresi logistik, tiga model [18, 23, 28] dengan regresi risiko Cox, dan satu model [19] menggunakan regresi persaingan Fine dan Gray. Tambahan pula, terdapat tiga model yang menggunakan kaedah pembelajaran mesin (pohon keputusan [17], model rangkaian Bayesian [14], dan model hutan rawak [20]).
-
b)
Penggeledahan
Umur [16], penyakit kronik [16], jantina [9], dan taraf kesihatan sendiri [5] adalah antara faktor yang sering dinyatakan dalam model ramalan.
-
c)
Pengesahan model
Lima model [13, 14, 22, 23] tidak menjalani pengesahan, sementara sebelas model yang lain hanya melalui pengesahan dalaman dengan kaedah splitting rawak, bootstrap, atau pengesahan silang. Satu model [26] melalui pengesahan dalaman dan luaran.
-
d)
Prestasi model
Statistik C/AUC bagi 17 model yang dimasukkan berkisar antara 0.650 hingga 0.853; sembilan model [17, 20, 21, 22, 23, 24, 27, 28] mempunyai C statistik/AUC di atas 0.75, menunjukkan diskriminasi yang boleh diterima [36]. Penilaian kalibrasi tidak dilaporkan dalam tujuh model, tetapi beberapa model menunjukkan prestasi kalibrasi yang baik.
-
e)
Penyampaian model
Model-model yang berbeza dibentangkan dengan cara yang pelbagai: bulan [13, 22, 25] memaparkan hasil regresi logistik, sementara yang lain menggunakan skor risiko, nomogram, dan alat penilaian web untuk memaparkan keputusan.
Risiko Bias, Kebolehlaksanaan, dan Nilai Klinikal Kajian
Jadual 3 menunjukkan hasil penilaian risiko bias dan kebolehlaksanaan kajian yang dimasukkan. Semua 16 kajian dinilai sebagai berisiko tinggi terhadap bias, 10 kajian [15, 16, 17, 18, 19, 20, 21, 23, 24, 28] mempunyai kebimbangan tinggi terhadap kebolehlaksanaan, dan enam kajian [13, 14, 22, 25, 26, 27] dianggap mempunyai kebimbangan rendah.
Dalam domain peserta, satu kajian [17] berisiko tinggi kerana melibatkan kumpulan umur yang berbeza dalam tiga kawasan, menyebabkan hasilnya mungkin tidak mewakili kumpulan tertentu. Beberapa kajian lain juga mempunyai kebimbangan tinggi disebabkan ketidakselesaan pemilihan peserta.
Beralih kepada domain pengukuran, satu kajian [16] didapati berisiko tinggi kerana mengumpulkan data dari empat kohort berbeza dan mungkin menggunakan kaedah berbeza untuk mengukur faktor yang diwarisi. Lima kajian [13, 14, 22] tidak menjelaskan jika pengukuran dilakukan tanpa pengetahuan hasil, manakala kajian lain [18] mempunyai ketidaktentuan dalam timing pengukuran.
Untuk domain hasil, risiko bias timbul dari penggunaan pengukuran yang tidak ketat dalam beberapa kajian [14, 17, 19, 20, 21, 23, 28]. Walaupun semua kajian menunjukkan kebolehlaksanaan rendah dalam domain ini, mereka perlu lebih teliti.
Jadual 4 pula memaparkan keputusan penilaian nilai klinikal semua model yang dimasukkan. Sejauh ini, tujuh model [13, 14, 22, 25, 26, 27] menunjukkan kebolehlaksanaan rendah, namun 10 model [13, 16, 18, 19, 22, 24, 25, 26, 28] melaporkan dengan lengkap semua ukuran prestasi.
Dua model dengan nilai klinikal tertinggi yang ditonjolkan adalah dari Ai et al. (2021) [13] yang meramalkan kebergantungan ADL pada individu berumur 60 ke atas dengan AUC penerimaan yang baik (0.742) serta Zhang et al. (2021) [26] yang meramalkan IADL berlandaskan kriteria serupa.