亚洲 国产精品 日韩-亚洲 激情-亚洲 欧美 91-亚洲 欧美 成人日韩-青青青草视频在线观看-青青青草影院

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > Gpu Instancing技術

Gpu Instancing技術

來源:千鋒教育
發布人:qyf
時間: 2022-08-29 16:08:05 1661760485

  一、前言

  在3D游戲中,制作者希望能夠繪制越來越多的場景物體,比如場景中大量的植被(樹木,草,花等),能夠給玩家帶來更加逼真的體驗。但是這對對于設備(尤其是移動端)的性能是個極大的考驗,如果使用傳統的技術,大批量渲染會導致drawcall增加,fps下降。unity推出了Gpu Instancing技術,這對于大量相同物體的繪制提供了一個新的方案,我們嘗試在unity中使用gpu instance 技術。

  二、靜態物體使用Gpu Instance

  Gpu Instance是一種用來提高渲染大量物體效率的技術,在場景里繪制越來越多的物體,這里面主要涉及兩個方面的性能瓶頸,一是cpu對gpu提交數據的次數(包括設置數據buffer,渲染狀態以及調用對渲染原語的繪制即drawcall),二是gpu上的繪制(包括頂點處理和像素繪制),隨著場景物體的提升,cpu和gpu的壓力都會上升。目前在一些典型的3D游戲的制作中,我們的經驗值是全屏不超過10萬個頂點和200個draw call左右,不然對中端機器會有一定壓力。

  為了解決場景繪制效率這個問題,主要有以下幾種優化方案:

  static batching: 即靜態合批,靜態合批的原理即化整為零,將多個場景物體預先合成一個大的物體進行繪制,unity5的實現就是整合成一個大的vbo,而不整合IBO,一次性提交vbo給gpu,然后并不是把整個vbo都繪制,而是每次需要繪制其中某個某些物體時改變IBO,選擇大vbo上的某一段進行繪制。靜態合批可以將多個小物體的繪制合并成一個大物體的繪制,減少對渲染狀態的改變,它一次并行繪制多個物體,理論上是最快的繪制方法,不過最大的缺點是因為合成新的大vbo需要耗費額外的大量內存,同時不能渲染動態物體,因為合并vbo的時候已經確定頂點數據了,頂點數據不能更改(例如unity5對LOD合批的實現也是講所有層次的lod都預先合并進去),另外一個vbo的大小是有限制的,如果物體數量過多,也會被拆成多個繪制。

  dynamic batching:動態合批,可以解決對頂點數據有變化的物體的合批,它動態的合并vbo進行提交,組建vbo的時間有消耗,為了減少這個消耗,unity對動態合批的vbo大小有限制,以致于很小頂點數的物體才有可能被動態合批。

  vertex constant instancing:Instancing 是不同于batching的另一種方案,它的原理是對于模型一致的物體,只提交原始的模型的vbo給gpu,然后將每個物體不同的屬性單獨抽出來組成buffer發給gpu,在顯卡中根據這一份vbo和每個物體不同的屬性來繪制多個物體,即一次提交,在gpu上繪制多個,對于大量同樣模型的物體繪制是一個很好的方案。vertex constant的instancing是利用頂點常量屬性來存儲這些per instance attributes,但是也需要一個大的vbo存儲所有未經頂點變換的相同的n個原頂點數據,在shader里面讀取不同的vertex constant內容繪制不同的instance

  gpu instancing:這是最新渲染api提供的一種技術,如果繪制1000個物體,它將一個模型的vbo提交給一次給顯卡,至于1000個物體不同的位置,狀態,顏色等等將他們整合成一個per instance attribute的buffer給gpu,在顯卡上區別繪制,它大大減少提交次數,它在不同平臺的實現有差異,例如gles是將per instance attribute也當成一個vbo提交,然后gles3.0支持一種per instance步進讀取的vbo特性,來實現不同的instance得到不同的頂點數據,這種技術對于繪制大量的相同模型的物體由于有硬件實現,所以效率最高,最為靈活,避免合批的內存浪費,并且原則上可以做gpu skinning來實現骨骼動畫的instancing。

  Unity5中實現instance

  unity中提供了兩種使用gpu instance的機制,自動和手動:

  自動:需要使用unity 標準的standar 或surfaceshader,然后在mat下面的instacne那里打勾,然后unity在條件合適的情況下自動instance,但是注意這種限制非常多,如不能static batch,不能liaghtmap,不能改變mat,不能帶動作,不能cull,等等,非常難,詳見https://docs.unity3d.com/Manual/GPUInstancing.html

  手動:通過使用Graphics.DrawMeshInstanced或者Graphics.DrawMeshInstancedIndirect這些底層api。

  由于unity自動的instance不穩定且不能lightmap等等,于是我們的實現方案是自己用底層api去實現instance,并且自己去實現了支持lightmap和culling的instance。

  三、帶骨骼動畫的物體使用Gpu Instance

  gpuinstancing可以很好的工作在靜態物體上,例如草,樹。但遺憾的是暫時還無法對骨骼動畫使用這個特性。而我們游戲經常使用上百個小兵單位作戰,如果可以讓小兵使用這個特性,那么對于性能的提升無疑是很可觀的。于是有人提出了將動畫信息烘焙到貼圖中,在shader里面根據貼圖設置頂點位置,也就是我們的頂點動畫。這樣的話,模型就既可以像骨骼動畫那樣播放動作,又可以使用gpuinstancing合批了。做法也非常簡單,就是把Skinmesh變成MeshRender,然后把骨骼和動畫信息,記錄在一張貼圖上,然后把動畫的運算放到shader里。 本來這樣就可以了,但實際使用過程中卻發現了幾個問題。

  1.烘焙的貼圖過大,因為為了存儲浮點數,必須使用rgbahalf的格式,這個格式每個像素有64個字節,是真彩色的兩倍。假設一個小兵有1000個頂點,那么1s的動作就需要1000*64,也就是64000個字節,而正常情況下,我們小兵在2000個頂點左右,動畫在5s以上,那么每個動畫貼圖大概就在2M以上,甚至有可能是4M。而我們有60多個兵種,這樣一算竟然有240M。雖然小米超神使用了RGMB來減少每個像素的大小,但那也高達120M的動畫貼圖了。而我們知道,原始的骨骼動畫數據其實只有幾百k左右。

  2.無法計算光照,因為法線始終保持T-pos形態,在shader里面改變頂點位置的時候,無法重新計算法線。為了能夠使用正常的光照計算,必須將法線也一起烘焙。幸運的是法線都是單位向量,可以采用rgba存儲,但也需要大概1M左右的空間。

  3.沒有動畫之間的blend,為了實現blend,必須對兩個動作的貼圖進行采樣,然后lerp。這樣會導致shader里放兩張4M的貼圖,對手游來說還是不小的開銷。

  綜上所述,我最終還是采納了M神的建議,使用了烘焙骨骼信息的方案。

  來看看原理,烘焙頂點很好理解,就是把位置的值存到貼圖中。那么如何烘焙骨骼信息,然后得到頂點位置呢?首先我們要理解骨骼動畫的原理,這里引用UWA博客里面的一段話:

圖片4

  當然上面的描述很簡單,如果想要了解更加詳細的推倒過程,可以看Milo大神的書《游戲引擎架構xxx》里面的蒙皮的數學這一章。

  總之,結論就是從當前骨骼的bindpos一直左乘到根骨骼。

  代碼也非常簡單:

  for (int j = 0; j < bones.Length; j++)

  {

  GPUSkinningBone currentBone = bones[j];

  Matrix4x4 lastMat = currentBone.bindpose;

  while (true)

  {

  if (currentBone.parentBoneIndex == -1)

  {

  Matrix4x4 mat = Matrix4x4.TRS(currentBone.transform.localPosition, currentBone.transform.localRotation, currentBone.transform.localScale);

  if(rootBone.transform != go.transform)

  {

  mat = Matrix4x4.TRS(Vector3.zero, Quaternion.identity, go.transform.localScale) * mat;

  }

  lastMat = mat * lastMat;

  break;

  }

  else

  {

  Matrix4x4 mat = Matrix4x4.TRS(currentBone.transform.localPosition, currentBone.transform.localRotation, currentBone.transform.localScale);

  lastMat = mat * lastMat;

  currentBone = bones[currentBone.parentBoneIndex];

  }

  }

  animMap.SetPixel(j * 3, k + 1, new Color(lastMat.m00, lastMat.m01, lastMat.m02, lastMat.m03));

  animMap.SetPixel(j * 3 + 1, k + 1, new Color(lastMat.m10, lastMat.m11, lastMat.m12, lastMat.m13));

  animMap.SetPixel(j * 3 + 2, k + 1, new Color(lastMat.m20, lastMat.m21, lastMat.m22, lastMat.m23));

  if (k == startFrame)

  {

  animMap.SetPixel(j * 3, k, new Color(lastMat.m00, lastMat.m01, lastMat.m02, lastMat.m03));

  animMap.SetPixel(j * 3 + 1, k, new Color(lastMat.m10, lastMat.m11, lastMat.m12, lastMat.m13));

  animMap.SetPixel(j * 3 + 2, k, new Color(lastMat.m20, lastMat.m21, lastMat.m22, lastMat.m23));

  }

  else if(k == curClipFrame1 + startFrame - 3)

  {

  animMap.SetPixel(j * 3, k + 2, new Color(lastMat.m00, lastMat.m01, lastMat.m02, lastMat.m03));

  animMap.SetPixel(j * 3 + 1, k + 2, new Color(lastMat.m10, lastMat.m11, lastMat.m12, lastMat.m13));

  animMap.SetPixel(j * 3 + 2, k + 2, new Color(lastMat.m20, lastMat.m21, lastMat.m22, lastMat.m23));

  }

  }

  最重要的部分就是生成矩陣的那里。這里有幾個注意點,一個是根骨骼可能有多個,那么你只需要將他們共同的父親放到根節點,把這個其實沒有骨骼的節點處理成默認矩陣的情況就可以。第二個是因為貼圖采樣有可能采樣到邊緣,為了防止精確度不夠引起動畫抖動,我前后各多增加了一幀,防止抖動。

  然后是shader部分:

  v2f vert(appdata v)

  {

  UNITY_SETUP_INSTANCE_ID(v);

  float start = UNITY_ACCESS_INSTANCED_PROP(Props, _AnimStart);

  float end = UNITY_ACCESS_INSTANCED_PROP(Props, _AnimEnd);

  float off = UNITY_ACCESS_INSTANCED_PROP(Props, _AnimOff);

  float speed = UNITY_ACCESS_INSTANCED_PROP(Props, _Speed);

  float _AnimLen = (end - start);

  float f = (off + _Time.y * speed) / _AnimLen;

  f = fmod(f, 1.0);

  float animMap_x1 = (v.uv2.x * 3 + 0.5) * _AnimMap_TexelSize.x;

  float animMap_x2 = (v.uv2.x * 3 + 1.5) * _AnimMap_TexelSize.x;

  float animMap_x3 = (v.uv2.x * 3 + 2.5) * _AnimMap_TexelSize.x;

  float animMap_y = (f * _AnimLen + start) / _AnimAll;

  float4 row0 = tex2Dlod(_AnimMap, float4(animMap_x1, animMap_y, 0, 0));

  float4 row1 = tex2Dlod(_AnimMap, float4(animMap_x2, animMap_y, 0, 0));

  float4 row2 = tex2Dlod(_AnimMap, float4(animMap_x3, animMap_y, 0, 0));

  float4 row3 = float4(0, 0, 0, 1);

  float4x4 mat = float4x4(row0, row1, row2, row3);

  float4 pos = mul(mat, v.vertex);

  float3 normal = mul(mat, float4(v.normal, 0)).xyz;

  v2f o;

  UNITY_TRANSFER_INSTANCE_ID(v, o);

  o.uv = TRANSFORM_TEX(v.uv, _MainTex);

  o.vertex = UnityObjectToClipPos(pos);

  o.color = float4(0, 0, 0, 0);

  o.worldNormal = UnityObjectToWorldNormal(normal);

  float3 normalDir = normalize(mul(float4(normal, 0.0), unity_WorldToObject).xyz);

  float frezz = UNITY_ACCESS_INSTANCED_PROP(Props, _Frezz);

  float3 normalWorld = o.worldNormal;

  fixed dotProduct = dot(normalWorld, fixed3(0, 1, 0)) / 2;

  dotProduct = max(0, dotProduct);

  o.color = dotProduct.xxxx * frezz;

  return o;

  }

  主要就是頂點著色器部分,我們把4x4的骨骼旋轉偏移矩陣存在貼圖里,因為最后一行是flaot4(0,0,0,1),為了節省空間,我們只存了3x4大小的矩陣,最后一行在shader里補上。然后直接將矩陣和頂點相乘,就可以得到蒙皮后的頂點位置。而且我們看到,法線也可以這么處理,就可以得到蒙皮后正確的法線。這里還有一個我沒有做的功能,就是骨骼權重,其實我將骨骼權重存進了頂點的uv2中,uv2.xy是第一根骨骼的索引和權重,uv2.zw是第二根骨骼的索引和權重,理論上需要將兩個骨骼結算的結果加權平均一下,但因為我測試發現精度夠了,就少采樣一次,節省點消耗。如果有需要,可以自己加上這個加權平均。

  還有一個未來需要做的,就是動畫之間的blend,需要額外增加一個變量控制blend的程度,對兩個時刻的動作分別采樣計算,然后lerp一下就可以了。

  我們看看用貼圖存儲骨骼需要的大小,假設一個小兵有25個骨骼,那么一個骨骼需要4x3個浮點數,也就是3個像素,那么需要75個像素,一個1s的動畫,也只需要75*64,大概4800字節而已。而且重要的是我們不受到頂點數的限制,而一個小兵的骨骼正常情況下就是30以內,我們得到了一個可控的合理的結果。

  四、總結

  使用Gpuinstance技術能極大的提示游戲的渲染性能,讓游戲能夠渲染更多的植被和動態物體,提高玩家的游戲樂趣。

  更多關于unity游戲培訓的問題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓服務經驗,采用全程面授高品質、高體驗培養模式,擁有國內一體化教學管理及學員服務,助力更多學員實現高薪夢想。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
无遮挡边吃奶边做刺激视频| 麻豆熟妇人妻XXXXXX| 久久婷婷五月综合97色直播| 免费男人下部进女人下部视频| 人妻精品一区二区三区蜜桃| 全免费A级毛片免费看| 国产CHINASEX对白VID| 国产欧美在线观看不卡| 久久精品国产导航| 欧美乱妇日本无乱码特黄大片 | 国产99久9在线 | 传媒| 好男人HD免费观看| 无人高清视频免费观看在线| 亚洲成亚洲乱码一二三四区软件| 中文亚洲AV片在线观看无码| 公交车上噗嗤一声尽根而没 | 男友把舌头都伸进我的嘴巴里了| 上司侵犯下属人妻中文字幕| 亚洲老熟女XXXXHDWAA| JLZZJLZZ亚洲| 国精产品一区一区三区| 国产成人涩涩涩视频在线观看| 黑人巨茎中出人妻| 欧美精品亚洲精品日韩传电影| 调教狠扇打肿私密跪撅屁股作文| 亚洲一线产区二线产区区别在哪儿| H罩杯大胸爆乳交在线观看| 国产精品乱码高清在线观看| 麻豆国产成人AV高清在线| AV国内精品久久久久影院| 成人免费看WWW网址入口| 狠狠色丁香久久婷婷综合五月| 欧美三级在线播放| 亚洲成a人片8888一在线观看| FREEXXX欧美老妇| 黑人巨鞭大战丰满少妇| 人妻洗澡被强公日日澡| 亚洲六月丁香色婷婷综合久久| 波多野结衣的AV电影| 久久av蜜臀人妻一区二区三区| 日本熟妇人妻XXXXX-欢迎您| 亚洲国产精品嫩草影院久久| 被C哭着爬走又被拉回来挺进H| 精品无码视频一区二区三区| 色婷婷五月综合亚洲影院| 永久黄网站色视频免费品善网 | 中文在线最新版天堂8| 国产精品久久久久久久福利| 内射人妻无码色AV天堂| 亚洲AV无码一区东京热久久| 残忍开嫩苞疼哭了视频| 久久久国产乱子伦精品| 图片区小说区AV区| AV无码一区二区大桥久未| 精品深夜av无码一区二区老年| 少妇人妻好深太紧了A| 最新国产精品拍自在线观看| 国农村精品国产自线拍| 色欲久久久天天天综合网| 18禁黄网站禁片免费观看香港| 国语自产拍精品香蕉在线播放| 日本极品白嫩ASSPICS| 岳打开双腿开始配合交换| 国产午夜亚洲精品理论片八戒| 日本一道综合久久AⅤ免费| 中国熟妇色XXXXX中国老妇| 好男人好资源在线影视官网| 色老头精品午夜福利视频| AAA欧美色吧激情视频| 久久精品无码一区二区软件| 西西大胆无码视频免费| 大肉大捧一进一出好爽视频| 内射人妻无套中出无码| 亚洲欧美日韩、中文字幕不卡| 国产精品XXX大片免费观看| 人和畜禽CROPROATION| 在线精品国产成人综合| 精品熟人妻一区二区三区在线 | 人妻无码中文字幕永久有效视频| 岳故意装睡让我挺进去观看| 国语对白国产成人AⅤ片| 天天爽夜夜爽夜夜爽精品视频| 白嫩光屁股BBBBBBBBB| 牛鞭进入女人下身的视频| 一本一本久久A久久综合精品蜜桃| 国色天香精品一卡2卡3卡老狼| 天堂AV无码大芭蕉伊人AV不卡| 被老汉耸动呻吟双性美人| 麻花传媒剧国产MV入口在线观看| 亚洲欧美在线一区中文字幕| 国产作爱视频免费播放| 无码人妻精品一区二区三区99仓 | 欧美最猛性XXXXX免费| 1000部拍拍拍18勿入免费视频下载| 久久国产精品99久久人人澡| 亚洲国产成人精品青青草原导航 | 亚洲AV无码成H人动漫无遮挡| 国99精品无码一区二区三区| 日产乱码一二三区别免费下载| А√天堂BT中文在线| 欧美黑人粗暴多交高潮水最多| 欲香欲色天天天综合和网| 久久久久久妓女精品影院| 亚洲欧美日韩国产精品一区二区 | 亚洲欧洲日产国码中文字幕| 黑人女性猛交XXXXXⅩXX蘑| 人妻人人澡人人添人人爽| 中文字幕无码AV正片AV| 久久久久久亚洲AV无码蜜芽| 亚洲国产成人精品无码区在线观看 | 色欲久久九色一区二区三区| 18禁强伦姧人妻又大又| 被多人玩弄的烂货苏妖精| 欧美性受XXXX人人本视频| 99久在线国内在线播放免费观看| 男女24式动态图| 69无人区码一二三四区别| 年轻丰满的继牳3免费看| 中文字幕肉感巨大的乳专区| 蜜芽AV在线新地址| 99精产国品一二三产区区别网站| 投诉12345最狠的办法| 国产99久9在线 | 传媒| 私人影院无在线码免费| 国产精华液一二三区别| 喜爱夜蒲在线观看| 国内精品伊人久久久影视| 亚洲AV无码片区一区二区三区 | 欧美V日韩V亚洲V最新在线观看| 69精产国品一二三产区区别| 欧美午夜性春猛交ⅩXXX男| 菠萝蜜一线二线三线品牌| 少妇高潮太爽了在线观看欧美| 国产黑色丝袜在线视频| 亚洲AV极品熟妇一品二品三品| 姬小满无限奖励别人的英雄| 亚洲午夜精品一区二区| 邻居少妇张开腿让我爽了在线观看| 337P粉嫩日本欧洲亚洲大胆| 强开小婷嫩苞又嫩又紧韩国视频| 成人做爰高潮A片免费视频| 婷婷色香五月综合激激情| 女教师的凌脣教室在线| 中国BGMBGMBGM老妇和青年交| 日本精品VIDEOSSEX 黑| 99精产国品一二产区在线| 免费AV永久免费网址| 中文人妻无码一区二区三区在线| 精品少妇人妻AV免费久久久| 小S货又想挨C了叫大声点| 国产麻豆剧传媒精品国产AV蜜桃| 一边喘气一边叫疼的视频| 久久久久久精品成人网站| 色欲AV久久一区二区三区久| 国产成人午夜性A一级毛片老女人 国产成人午夜无码电影在线观看 国产成人午夜精品影院 | 国产SUV精品一区二区四区三区| 午夜人妻久久久久久久久| 久久精品中文闷骚内射| CAOPORN免费视频在线| 丝瓜成视频人APP下载网站| 韩国18禁电影风暴尺度大| 在线观看亚洲AV电影网站| 日本熟妇HD人妻| 国内精品久久久久久久999| 在出租屋里被强高H| 日产精品一二三区| 国产中国男男GayGay| 中文亚洲AV片在线观看不卡| 日韩精品视频一区二区| 炖肉计(是今)海棠| 亚洲AV永久无码精品一区二区不 | 国内极度色诱视频网站| 在教室伦流澡到高潮H强圩电影| 日本亲近相奷中文字幕| 国产综合18久久久久久| 中文字幕女人妻热女人妻| 色综合久久综合欧美综合网| 激情亚洲一区国产精品| BBW厕所白嫩BBW| 亚洲AV成人网站在线观看| 女人18片毛片60分钟630| 国产精品日本一区二区在线播放| 野花社区在线观看免费直播WWW| 日本人妻人人人澡人人爽| 国内精品免费视频自在线拍| 7777色情XXXX欧美| 无码一区二区三区视频| 免费无码鲁丝片一区二区| 国产精品IGAO视频| 中文无码乱人伦中文视频在线V| 试看20分钟做受| 巨大黑人XXXXX高潮| 国产AⅤ无码专区亚洲AV麻豆| 一二三四影视在线观看免费视频| 色婷婷综合久久久久中文字幕| 久久久AV波多野一区二区 | 少妇MM被擦出白浆液视频| 久久精品无码一区二区三区| 丰满岳乱妇在线观看中字| 一面膜上边一面膜下边韩国|