फ़्रेम प्रोफ़ाइलिंग का इस्तेमाल करके, वर्टेक्स से जुड़ी परफ़ॉर्मेंस की कुछ संभावित समस्याओं का पता लगाया जा सकता है. कमांड पैन का इस्तेमाल करके, अपने गेम के किसी फ़्रेम में किए गए सभी ड्रॉ कॉल और हर ड्रॉ कॉल के हिसाब से ड्रॉ किए गए प्रिमिटिव की संख्या देखें. इससे, एक फ़्रेम में सबमिट किए गए वर्टेक्स की कुल संख्या का अनुमान लगाया जा सकता है.
glDrawElements कॉल के लिए फ़्रेम प्रोफ़ाइलिंग व्यू. इसमें 2,718 ट्राएंगल प्रिमिटिव दिखाए गए हैंVertex attribute compression
आपके गेम को एक आम समस्या का सामना करना पड़ सकता है. यह समस्या, औसत वर्टेक्स साइज़ का बड़ा होना है. ज़्यादा वर्टेक्स सबमिट करने और हर वर्टेक्स का साइज़ बड़ा होने पर, जीपीयू को वर्टेक्स मेमोरी से डेटा पढ़ने के लिए ज़्यादा बैंडविड्थ की ज़रूरत होती है.
किसी दिए गए ड्रॉ कॉल के लिए वर्टेक्स फ़ॉर्मैट देखने के लिए, यह तरीका अपनाएं:
अपनी पसंद का कोई ड्रॉ कॉल चुनें.
यह सीन के लिए सामान्य ड्रॉ कॉल, बड़ी संख्या में वर्टेक्स वाला ड्रॉ कॉल, जटिल कैरेक्टर मॉडल के लिए ड्रॉ कॉल या किसी अन्य तरह का ड्रॉ कॉल हो सकता है.
पाइपलाइन पैनल पर जाएं. इसके बाद, इनपुट असेंबली के लिए IA पर क्लिक करें. इससे जीपीयू में आने वाले वर्टेक्स के वर्टेक्स फ़ॉर्मैट के बारे में पता चलता है.
एट्रिब्यूट और उनके फ़ॉर्मैट की सीरीज़ देखें. उदाहरण के लिए,
R32G32B32_SFLOATएक 3-कॉम्पोनेंट वाला 32-बिट साइंड फ़्लोट है.
अक्सर, वर्टेक्स एट्रिब्यूट को कंप्रेस किया जा सकता है. इससे, मॉडल की क्वालिटी में बहुत कम गिरावट आती है. खास तौर पर, हमारा सुझाव है कि आप:
- वर्टेक्स की पोज़िशन को हाफ़-प्रिसिशन वाले 16-बिट फ़्लोट में कंप्रेस किया जा रहा है
- यूवी टेक्सचर कोऑर्डिनेट को 16-बिट के बिना हस्ताक्षर वाले पूर्णांकों में कंप्रेस करना
- क्वाटर्नियन का इस्तेमाल करके, सामान्य, स्पर्शरेखा, और द्विलंबवत वेक्टर को एन्कोड करके, स्पर्शरेखा स्पेस को कंप्रेस करना
अन्य एट्रिब्यूट को भी, हर मामले के हिसाब से कम सटीक टाइप के लिए इस्तेमाल किया जा सकता है.
वर्टेक्स स्ट्रीम स्प्लिटिंग
यह भी पता लगाया जा सकता है कि वर्टेक्स एट्रिब्यूट स्ट्रीम को सही तरीके से स्प्लिट किया गया है या नहीं. टाइल वाली रेंडरिंग आर्किटेक्चर, जैसे कि मोबाइल जीपीयू पर, वर्टेक्स की पोज़िशन का इस्तेमाल सबसे पहले बिनिंग पास में किया जाता है. इससे हर टाइल में प्रोसेस किए गए प्रिमिटिव के बिन बनाए जाते हैं. अगर वर्टेक्स एट्रिब्यूट को एक ही बफ़र में इंटरलीव किया जाता है, तो सभी वर्टेक्स डेटा को बिनिंग के लिए कैश मेमोरी में पढ़ा जाता है. भले ही, सिर्फ़ वर्टेक्स पोज़िशन का इस्तेमाल किया गया हो.
वर्टेक्स रीड मेमोरी बैंडविड्थ को कम करने और कैश मेमोरी की परफ़ॉर्मेंस को बेहतर बनाने के लिए, वर्टेक्स डेटा को दो अलग-अलग स्ट्रीम में बांटना चाहिए. इससे बिनिंग पास पर लगने वाला समय कम हो जाता है. एक स्ट्रीम में वर्टेक्स की पोज़िशन और दूसरी स्ट्रीम में वर्टेक्स के अन्य सभी एट्रिब्यूट होने चाहिए.
यह पता लगाने के लिए कि वर्टेक्स एट्रिब्यूट को सही तरीके से बांटा गया है या नहीं:
अपनी पसंद का ड्रॉ कॉल चुनें और ड्रॉ कॉल नंबर नोट करें.
यह सीन के लिए सामान्य ड्रॉ कॉल, बड़ी संख्या में वर्टेक्स वाला ड्रॉ कॉल, जटिल कैरेक्टर मॉडल के लिए ड्रॉ कॉल या किसी अन्य तरह का ड्रॉ कॉल हो सकता है.
पाइपलाइन पैनल पर जाएं. इसके बाद, इनपुट असेंबली के लिए IA पर क्लिक करें. इससे, जीपीयू में आने वाले वर्टेक्स के लिए वर्टेक्स फ़ॉर्मैट तय होता है.
अपने वर्टेक्स एट्रिब्यूट की बाइंडिंग देखें. आम तौर पर, ये लीनियर तरीके से बढ़ सकती हैं (0, 1, 2, 3 वगैरह), लेकिन ऐसा हमेशा नहीं होता. वर्टेक्स पोज़िशन आम तौर पर, वर्टेक्स एट्रिब्यूट की सूची में सबसे पहले होती है.
स्टेट पैनल में,
LastDrawInfosढूंढें और मैच करने वाले ड्रॉ कॉल नंबर को बड़ा करें. इसके बाद, इस ड्रॉ कॉल के लिएBoundVertexBuffersको बड़ा करें.दिए गए ड्रॉ कॉल के दौरान, बाउंड किए गए वर्टेक्स बफ़र देखें. इनके इंडेक्स, पहले के वर्टेक्स एट्रिब्यूट बाइंडिंग से मेल खाते हैं.
अपने ड्रॉ कॉल के वर्टेक्स एट्रिब्यूट के लिए बाइंडिंग को बड़ा करें और बफ़र को बड़ा करें.
बफ़र के लिए
VulkanHandleदेखें. ये बफ़र, उस मेमोरी को दिखाते हैं जहां से वर्टेक्स डेटा सोर्स होता है. अगरVulkanHandleअलग-अलग हैं, तो इसका मतलब है कि एट्रिब्यूट अलग-अलग बफ़र से मिले हैं. अगरVulkanHandleएक जैसे हैं, लेकिन ऑफ़सेट बड़े हैं (उदाहरण के लिए, 100 से ज़्यादा), तो एट्रिब्यूट अब भी अलग-अलग सब-बफ़र से मिल सकते हैं. हालांकि, इसके लिए आगे की जांच ज़रूरी है.
वर्टेक्स स्ट्रीम स्प्लिटिंग और अलग-अलग गेम इंजन पर इसे ठीक करने के तरीके के बारे में ज़्यादा जानकारी के लिए, इस विषय पर हमारी ब्लॉग पोस्ट देखें.