| Dataset | Task | BITR | CCA | CCASMN | CFA | CMCP | HSNN | JGRHML | JRL | LGCFL | ml-CCA | mv-CCA | S2UPG |
| Wikipedia Dataset | Image->Text | 0.194 | 0.167 | 0.183 | 0.376 | 0.454 | 0.435 | 0.433 | 0.463 | 0.422 | 0.360 | 0.174 | 0.468 |
| Text->Image | 0.322 | 0.126 | 0.120 | 0.358 | 0.422 | 0.416 | 0.397 | 0.411 | 0.389 | 0.328 | 0.127 | 0.428 | |
| XMedia Dataset | Image->Text | 0.068 | 0.067 | 0.076 | 0.240 | 0.325 | 0.301 | 0.314 | 0.308 | 0.219 | 0.272 | 0.072 | 0.397 |
| Image->Video | 0.076 | 0.094 | 0.164 | 0.280 | 0.289 | 0.246 | 0.339 | 0.260 | 0.150 | 0.231 | 0.113 | 0.251 | |
| Image->Audio | 0.082 | 0.087 | 0.124 | 0.259 | 0.368 | 0.398 | 0.395 | 0.327 | 0.280 | 0.316 | 0.107 | 0.378 | |
| Image->3D | 0.107 | 0.087 | 0.098 | 0.456 | 0.561 | 0.422 | 0.582 | 0.576 | 0.313 | 0.464 | 0.210 | 0.660 | |
| Text->Image | 0.066 | 0.060 | 0.059 | 0.284 | 0.397 | 0.389 | 0.390 | 0.404 | 0.109 | 0.317 | 0.063 | 0.476 | |
| Text->Video | 0.081 | 0.110 | 0.127 | 0.136 | 0.174 | 0.157 | 0.201 | 0.158 | 0.074 | 0.121 | 0.118 | 0.182 | |
| Text->Audio | 0.079 | 0.127 | 0.155 | 0.136 | 0.213 | 0.215 | 0.183 | 0.182 | 0.083 | 0.160 | 0.155 | 0.224 | |
| Text->3D | 0.101 | 0.091 | 0.080 | 0.181 | 0.319 | 0.243 | 0.279 | 0.299 | 0.112 | 0.214 | 0.115 | 0.339 | |
| Video->Image | 0.062 | 0.059 | 0.132 | 0.246 | 0.319 | 0.266 | 0.359 | 0.272 | 0.121 | 0.315 | 0.083 | 0..233 | |
| Video->Text | 0.065 | 0.078 | 0.090 | 0.101 | 0.141 | 0.118 | 0.134 | 0.119 | 0.072 | 0.125 | 0.090 | 0.167 | |
| Video->Audio | 0.074 | 0.093 | 0.137 | 0.116 | 0.155 | 0.166 | 0.139 | 0.129 | 0.110 | 0.136 | 0.096 | 0.128 | |
| Video->3D | 0.106 | 0.098 | 0.107 | 0.178 | 0.238 | 0.176 | 0.255 | 0.242 | 0.130 | 0.256 | 0.156 | 0.208 | |
| Audio->Image | 0.063 | 0.065 | 0.088 | 0.275 | 0.409 | 0.430 | 0.422 | 0.347 | 0.196 | 0.315 | 0.079 | 0.422 | |
| Audio->Text | 0.061 | 0.106 | 0.122 | 0.110 | 0.195 | 0.182 | 0.142 | 0.159 | 0.100 | 0.125 | 0.122 | 0.209 | |
| Audio->Video | 0.096 | 0.114 | 0.142 | 0.151 | 0.195 | 0.170 | 0.181 | 0.145 | 0.100 | 0.136 | 0.096 | 0.142 | |
| Audio->3D | 0.118 | 0.102 | 0.108 | 0.147 | 0.343 | 0.285 | 0.318 | 0.285 | 0.170 | 0.256 | 0.153 | 0.333 | |
| 3D->Image | 0.071 | 0.058 | 0.056 | 0.424 | 0.520 | 0.423 | 0.616 | 0.579 | 0.215 | 0.425 | 0.116 | 0.631 | |
| 3D->Text | 0.048 | 0.062 | 0.067 | 0.109 | 0.198 | 0.161 | 0.183 | 0.199 | 0.089 | 0.147 | 0.075 | 0.273 | |
| 3D->Video | 0.097 | 0.097 | 0.101 | 0.186 | 0.199 | 0.147 | 0.318 | 0.191 | 0.165 | 0.166 | 0.126 | 0.167 | |
| 3D->Audio | 0.080 | 0.085 | 0.104 | 0.147 | 0.255 | 0.259 | 0.241 | 0.235 | 0.101 | 0.205 | 0.106 | 0.297 | |
| Average | 0.096 | 0.092 | 0.111 | 0.223 | 0.304 | 0.273 | 0.310 | 0.286 | 0.169 | 0.245 | 0.116 | 0.323 | |