‘ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ’ಯಲ್ಲಿ ಕಠಿಣ AI ಪ್ರಶ್ನೆಗಳಿಗೆ ತಜ್ಞರು ಜಾಗತಿಕ ಕರೆಯನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತಾರೆ

‘ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ’ಯಲ್ಲಿ ಕಠಿಣ AI ಪ್ರಶ್ನೆಗಳಿಗೆ ತಜ್ಞರು ಜಾಗತಿಕ ಕರೆಯನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತಾರೆ

ಮಕ್ಕಳ ಆಟದಂತಹ ಜನಪ್ರಿಯ ಮಾನದಂಡ ಪರೀಕ್ಷೆಗಳನ್ನು ಹೆಚ್ಚಾಗಿ ನಿರ್ವಹಿಸುವ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಒಡ್ಡಲು ಕಠಿಣ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೋರಿ ತಂತ್ರಜ್ಞಾನ ತಜ್ಞರ ತಂಡವು ಸೋಮವಾರ ಜಾಗತಿಕ ಕರೆಯನ್ನು ನೀಡಿದೆ.

“ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ” ಎಂದು ಕರೆಯಲ್ಪಡುವ ಯೋಜನೆಯು ಪರಿಣಿತ-ಮಟ್ಟದ AI ಯಾವಾಗ ಬಂದಿದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ. ಭವಿಷ್ಯದ ವರ್ಷಗಳಲ್ಲಿ ಸಾಮರ್ಥ್ಯಗಳು ಮುಂದುವರೆದರೂ ಸಹ ಪ್ರಸ್ತುತವಾಗಿರಲು ಇದು ಗುರಿಯನ್ನು ಹೊಂದಿದೆ, ಸಂಘಟಕರ ಪ್ರಕಾರ, ಸೆಂಟರ್ ಫಾರ್ AI ಸೇಫ್ಟಿ (CAIS) ಮತ್ತು ಸ್ಟಾರ್ಟ್ಅಪ್ ಸ್ಕೇಲ್ AI ಎಂಬ ಲಾಭರಹಿತ ಸಂಸ್ಥೆ.

ಚಾಟ್‌ಜಿಪಿಟಿಯ ತಯಾರಕರು ಓಪನ್‌ಎಐ ಒ1 ಎಂದು ಕರೆಯಲ್ಪಡುವ ಹೊಸ ಮಾದರಿಯನ್ನು ಪೂರ್ವವೀಕ್ಷಿಸಿದ ಕೆಲವು ದಿನಗಳ ನಂತರ ಕರೆ ಬರುತ್ತದೆ, ಇದು “ಅತ್ಯಂತ ಜನಪ್ರಿಯ ತಾರ್ಕಿಕ ಮಾನದಂಡಗಳನ್ನು ನಾಶಪಡಿಸಿದೆ” ಎಂದು CAIS ನ ಕಾರ್ಯನಿರ್ವಾಹಕ ನಿರ್ದೇಶಕ ಮತ್ತು ಎಲೋನ್ ಮಸ್ಕ್‌ನ xAI ಸ್ಟಾರ್ಟ್‌ಅಪ್‌ನ ಸಲಹೆಗಾರ ಡಾನ್ ಹೆಂಡ್ರಿಕ್ಸ್ ಹೇಳಿದ್ದಾರೆ.

ಹೆಂಡ್ರಿಕ್ಸ್ ಎರಡು 2021 ಪೇಪರ್‌ಗಳನ್ನು ಸಹ-ಲೇಖಕರಾಗಿದ್ದಾರೆ, ಅದು ಈಗ ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ AI ಸಿಸ್ಟಮ್‌ಗಳ ಪರೀಕ್ಷೆಗಳನ್ನು ಪ್ರಸ್ತಾಪಿಸಿದೆ, ಒಂದು US ಇತಿಹಾಸದಂತಹ ವಿಷಯಗಳ ಪದವಿಪೂರ್ವ-ಮಟ್ಟದ ಜ್ಞಾನದ ಮೇಲೆ ಅವುಗಳನ್ನು ಕ್ವಿಜ್ ಮಾಡುವುದು, ಇನ್ನೊಂದು ಮಾದರಿಗಳು ಸ್ಪರ್ಧೆಯ ಮಟ್ಟದ ಗಣಿತದ ಮೂಲಕ ತರ್ಕಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಪರಿಶೀಲಿಸುತ್ತದೆ. ಪದವಿಪೂರ್ವ ಶೈಲಿಯ ಪರೀಕ್ಷೆಯು ಆನ್‌ಲೈನ್ AI ಹಬ್ ಹಗ್ಗಿಂಗ್ ಫೇಸ್‌ನಿಂದ ಅಂತಹ ಯಾವುದೇ ಡೇಟಾಸೆಟ್‌ಗಿಂತ ಹೆಚ್ಚಿನ ಡೌನ್‌ಲೋಡ್‌ಗಳನ್ನು ಹೊಂದಿದೆ.

ಆ ಪತ್ರಿಕೆಗಳ ಸಮಯದಲ್ಲಿ, AI ಪರೀಕ್ಷೆಗಳಲ್ಲಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಬಹುತೇಕ ಯಾದೃಚ್ಛಿಕ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತಿತ್ತು. “ಅವರು ಈಗ ಪುಡಿಮಾಡಿದ್ದಾರೆ,” ಹೆಂಡ್ರಿಕ್ಸ್ ರಾಯಿಟರ್ಸ್ಗೆ ತಿಳಿಸಿದರು.

ಒಂದು ಉದಾಹರಣೆಯಾಗಿ, AI ಲ್ಯಾಬ್ ಆಂಥ್ರೊಪಿಕ್‌ನ ಕ್ಲೌಡ್ ಮಾದರಿಗಳು 2023 ರಲ್ಲಿ ಪದವಿಪೂರ್ವ ಹಂತದ ಪರೀಕ್ಷೆಯಲ್ಲಿ ಸುಮಾರು 77% ಸ್ಕೋರ್ ಮಾಡುವುದರಿಂದ ಒಂದು ವರ್ಷದ ನಂತರ ಸುಮಾರು 89% ಕ್ಕೆ ತಲುಪಿದೆ, ಪ್ರಮುಖ ಸಾಮರ್ಥ್ಯಗಳ ಲೀಡರ್‌ಬೋರ್ಡ್ ಪ್ರಕಾರ.

ಈ ಸಾಮಾನ್ಯ ಮಾನದಂಡಗಳು ಪರಿಣಾಮವಾಗಿ ಕಡಿಮೆ ಅರ್ಥವನ್ನು ಹೊಂದಿವೆ.

ಏಪ್ರಿಲ್‌ನಿಂದ ಸ್ಟ್ಯಾನ್‌ಫೋರ್ಡ್ ವಿಶ್ವವಿದ್ಯಾನಿಲಯದ AI ಸೂಚ್ಯಂಕ ವರದಿಯ ಪ್ರಕಾರ, ಯೋಜನೆ ರೂಪಿಸುವಿಕೆ ಮತ್ತು ದೃಶ್ಯ ಮಾದರಿ-ಗುರುತಿಸುವಿಕೆಯ ಒಗಟುಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಕಡಿಮೆ-ಬಳಸಿದ ಪರೀಕ್ಷೆಗಳಲ್ಲಿ AI ಕಳಪೆಯಾಗಿ ಸ್ಕೋರ್ ಮಾಡಿದೆ. ಮಾದರಿ-ಗುರುತಿಸುವಿಕೆಯ ARC-AGI ಪರೀಕ್ಷೆಯ ಒಂದು ಆವೃತ್ತಿಯಲ್ಲಿ OpenAI o1 ಸುಮಾರು 21% ಗಳಿಸಿತು, ಉದಾಹರಣೆಗೆ, ARC ಸಂಘಟಕರು ಶುಕ್ರವಾರ ಹೇಳಿದರು.

ಕೆಲವು AI ಸಂಶೋಧಕರು ಈ ರೀತಿಯ ಫಲಿತಾಂಶಗಳು ಯೋಜನೆ ಮತ್ತು ಅಮೂರ್ತ ತಾರ್ಕಿಕತೆಯನ್ನು ಬುದ್ಧಿವಂತಿಕೆಯ ಉತ್ತಮ ಅಳತೆಗಳಾಗಿ ತೋರಿಸುತ್ತವೆ ಎಂದು ವಾದಿಸುತ್ತಾರೆ, ಆದರೂ ARC ನ ದೃಷ್ಟಿಗೋಚರ ಅಂಶವು ಭಾಷಾ ಮಾದರಿಗಳನ್ನು ನಿರ್ಣಯಿಸಲು ಕಡಿಮೆ ಸೂಕ್ತವಾಗಿರುತ್ತದೆ ಎಂದು ಹೆಂಡ್ರಿಕ್ಸ್ ಹೇಳಿದ್ದಾರೆ. “ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ”ಗೆ ಅಮೂರ್ತ ತಾರ್ಕಿಕತೆಯ ಅಗತ್ಯವಿರುತ್ತದೆ ಎಂದು ಅವರು ಹೇಳಿದರು.

ಸಾಮಾನ್ಯ ಮಾನದಂಡಗಳ ಉತ್ತರಗಳು AI ವ್ಯವಸ್ಥೆಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು ಬಳಸುವ ಡೇಟಾದಲ್ಲಿ ಕೊನೆಗೊಂಡಿರಬಹುದು ಎಂದು ಉದ್ಯಮ ವೀಕ್ಷಕರು ಹೇಳಿದ್ದಾರೆ. AI ಸಿಸ್ಟಮ್‌ಗಳ ಉತ್ತರಗಳು ಕಂಠಪಾಠದಿಂದಲ್ಲ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು “ಮಾನವೀಯತೆಯ ಕೊನೆಯ ಪರೀಕ್ಷೆ” ಕುರಿತು ಕೆಲವು ಪ್ರಶ್ನೆಗಳು ಖಾಸಗಿಯಾಗಿ ಉಳಿಯುತ್ತವೆ ಎಂದು ಹೆಂಡ್ರಿಕ್ಸ್ ಹೇಳಿದ್ದಾರೆ.

ಪರೀಕ್ಷೆಯು ನವೆಂಬರ್ 1 ರಿಂದ ಕನಿಷ್ಠ 1,000 ಜನಸಂದಣಿ-ಮೂಲದ ಪ್ರಶ್ನೆಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ, ಅದು ತಜ್ಞರಲ್ಲದವರಿಗೆ ಉತ್ತರಿಸಲು ಕಷ್ಟಕರವಾಗಿರುತ್ತದೆ. ಇವುಗಳು ಪೀರ್ ವಿಮರ್ಶೆಗೆ ಒಳಗಾಗುತ್ತವೆ, ಗೆಲುವಿನ ಸಲ್ಲಿಕೆಗಳು ಸಹ-ಲೇಖಕತ್ವವನ್ನು ನೀಡುತ್ತವೆ ಮತ್ತು ಸ್ಕೇಲ್ AI ನಿಂದ ಪ್ರಾಯೋಜಿತ $5,000 ವರೆಗಿನ ಬಹುಮಾನಗಳು.

“AI ಯ ಕ್ಷಿಪ್ರ ಪ್ರಗತಿಯನ್ನು ಅಳೆಯಲು ಪರಿಣಿತ-ಮಟ್ಟದ ಮಾದರಿಗಳಿಗಾಗಿ ನಮಗೆ ಕಠಿಣ ಪರೀಕ್ಷೆಗಳ ಅಗತ್ಯವಿದೆ” ಎಂದು ಸ್ಕೇಲ್‌ನ CEO ಅಲೆಕ್ಸಾಂಡರ್ ವಾಂಗ್ ಹೇಳಿದರು.

ಒಂದು ನಿರ್ಬಂಧ: ಸಂಘಟಕರು ಶಸ್ತ್ರಾಸ್ತ್ರಗಳ ಬಗ್ಗೆ ಯಾವುದೇ ಪ್ರಶ್ನೆಗಳನ್ನು ಬಯಸುವುದಿಲ್ಲ, ಇದು AI ಗೆ ಅಧ್ಯಯನ ಮಾಡಲು ತುಂಬಾ ಅಪಾಯಕಾರಿ ಎಂದು ಕೆಲವರು ಹೇಳುತ್ತಾರೆ.

(ಸ್ಯಾನ್ ಫ್ರಾನ್ಸಿಸ್ಕೋದಲ್ಲಿ ಜೆಫ್ರಿ ಡ್ಯಾಸ್ಟಿನ್ ಮತ್ತು ನ್ಯೂಯಾರ್ಕ್‌ನಲ್ಲಿ ಕೇಟೀ ಪಾಲ್ ಅವರ ವರದಿ; ಕ್ರಿಸ್ಟಿನಾ ಫಿಂಚರ್ ಸಂಪಾದನೆ)

ಎಲ್ಲವನ್ನೂ ಹಿಡಿಯಿರಿ ವ್ಯಾಪಾರ ಸುದ್ದಿ, ಮಾರುಕಟ್ಟೆ ಸುದ್ದಿ, ಬ್ರೇಕಿಂಗ್ ನ್ಯೂಸ್ ಘಟನೆಗಳು ಮತ್ತು ಇತ್ತೀಚಿನ ಸುದ್ದಿ ಲೈವ್ ಮಿಂಟ್‌ನಲ್ಲಿ ನವೀಕರಣಗಳು. ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ ಮಿಂಟ್ ನ್ಯೂಸ್ ಅಪ್ಲಿಕೇಶನ್ ದೈನಂದಿನ ಮಾರುಕಟ್ಟೆ ನವೀಕರಣಗಳನ್ನು ಪಡೆಯಲು.

ಇನ್ನಷ್ಟುಕಡಿಮೆ

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *