କୁହାଯାଇଛି ଯେ ଟେକ୍ନୋଲୋଜି କମ୍ପାନୀଗୁଡିକ ଜିପିୟୁ ପାଇଁ ଚେଷ୍ଟା କରୁଛନ୍ତି କିମ୍ବା ସେଗୁଡିକ ହାସଲ କରିବା ରାସ୍ତାରେ ଯାଉଛନ୍ତି। ଏପ୍ରିଲ୍ ମାସରେ, ଟେସଲା ସିଇଓ ଏଲୋନ୍ ମସ୍କ 10,000 ଜିପିୟୁ କିଣିଥିଲେ ଏବଂ କହିଥିଲେ ଯେ କମ୍ପାନୀ NVIDIA ରୁ ବହୁ ପରିମାଣର ଜିପିୟୁ କ୍ରୟ ଜାରି ରଖିବ | ଏଣ୍ଟରପ୍ରାଇଜ୍ ପାର୍ଶ୍ IT ରେ, ଆଇଟି କର୍ମକର୍ତ୍ତାମାନେ ମଧ୍ୟ ପୁଞ୍ଜି ନିବେଶର ରିଟର୍ଣ୍ଣକୁ ସର୍ବାଧିକ କରିବା ପାଇଁ ଜିପିୟୁଗୁଡିକ କ୍ରମାଗତ ଭାବରେ ବ୍ୟବହାର କରାଯିବା ନିଶ୍ଚିତ କରିବାକୁ କଠିନ ପରିଶ୍ରମ କରୁଛନ୍ତି | ତଥାପି, କେତେକ କମ୍ପାନୀ ଖୋଜି ପାଇପାରନ୍ତି ଯେ ଯେତେବେଳେ ଜିପିୟୁ ସଂଖ୍ୟା ବ increases େ, ଜିପିୟୁ ନିଷ୍କ୍ରିୟତା ଅଧିକ ଘୋର ହୋଇଯାଏ |
ଯଦି ଇତିହାସ ଆମକୁ ଉଚ୍ଚ କ୍ଷମତା ସମ୍ପନ୍ନ ଗଣନା (HPC) ବିଷୟରେ କିଛି ଶିକ୍ଷା ଦେଇଛି, ଏହା ହେଉଛି ଗଣନା ଉପରେ ଅଧିକ ଧ୍ୟାନ ଦେବା ଖର୍ଚ୍ଚରେ ଷ୍ଟୋରେଜ୍ ଏବଂ ନେଟୱାର୍କିଂକୁ ବଳି ଦିଆଯିବା ଉଚିତ୍ ନୁହେଁ | ଯଦି ଷ୍ଟୋରେଜ୍ କମ୍ପ୍ୟୁଟିଂ ୟୁନିଟ୍କୁ ଦକ୍ଷତାର ସହିତ ତଥ୍ୟ ସ୍ଥାନାନ୍ତର କରିପାରିବ ନାହିଁ, ଯଦିଓ ଆପଣଙ୍କର ଦୁନିଆରେ ସର୍ବାଧିକ GPU ଥାଏ, ତେବେ ଆପଣ ସର୍ବୋଚ୍ଚ ଦକ୍ଷତା ହାସଲ କରିବେ ନାହିଁ |
ଛୋଟ ୱାର୍ଲ୍ଡ ବିଗ୍ ଡାଟାର ଆନାଲିଷ୍ଟ ମାଇକ୍ ମ୍ୟାଚେଟ୍ଙ୍କ ଅନୁଯାୟୀ, ଛୋଟ ମଡେଲଗୁଡିକ ମେମୋରୀ (RAM) ରେ ଏକଜେକ୍ୟୁଟ୍ ହୋଇପାରିବ, ଯାହା ଗଣନା ଉପରେ ଅଧିକ ଧ୍ୟାନ ଦେବ | ତଥାପି, କୋଟି କୋଟି ନୋଡ ସହିତ ChatGPT ପରି ବୃହତ ମଡେଲଗୁଡିକ ଅଧିକ ମୂଲ୍ୟ ହେତୁ ସ୍ମୃତିସ୍ଥାନରେ ଗଚ୍ଛିତ ହୋଇପାରିବ ନାହିଁ |
ମ୍ୟାଚେଟ୍ କୁହନ୍ତି, “ଆପଣ ସ୍ମୃତିରେ କୋଟି କୋଟି ନୋଡ୍ ଫିଟ୍ କରିପାରିବେ ନାହିଁ, ତେଣୁ ଷ୍ଟୋରେଜ୍ ଅଧିକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହୋଇଯାଏ | ଦୁର୍ଭାଗ୍ୟବଶତ।, ଯୋଜନା ପ୍ରକ୍ରିୟା ସମୟରେ ତଥ୍ୟ ସଂରକ୍ଷଣକୁ ପ୍ରାୟତ over ଅଣଦେଖା କରାଯାଏ |
ସାଧାରଣତ ,, ବ୍ୟବହାର ମାମଲାକୁ ଖାତିର ନକରି, ମଡେଲ ତାଲିମ ପ୍ରକ୍ରିୟାରେ ଚାରୋଟି ସାଧାରଣ ପଏଣ୍ଟ ଅଛି:
ମଡେଲ୍ ଟ୍ରେନିଂ |
2 .।
ଡାଟା ଷ୍ଟୋରେଜ୍
ତ୍ୱରିତ ଗଣନା
ମଡେଲଗୁଡିକ ସୃଷ୍ଟି ଏବଂ ନିୟୋଜନ କରିବାବେଳେ, ଅଧିକାଂଶ ଆବଶ୍ୟକତା ଶୀଘ୍ର ପ୍ରୁଫ୍-ଅଫ୍-କନ୍ସେପ୍ଟ (POC) କିମ୍ବା ମଡେଲ୍ ଟ୍ରେନିଂ ଆରମ୍ଭ କରିବା ପାଇଁ ପରୀକ୍ଷଣ ପରିବେଶକୁ ପ୍ରାଥମିକତା ଦେଇଥାଏ, ଡାଟା ଷ୍ଟୋରେଜ୍ ଉପରେ ଅଧିକ ଧ୍ୟାନ ଦିଆଯାଇନଥାଏ |
ତଥାପି, ଆହ୍ .ାନଟି ହେଉଛି ଯେ ତାଲିମ କିମ୍ବା ଇନଫେରେନ୍ସ ନିୟୋଜନ ମାସ କିମ୍ବା ବର୍ଷ ପର୍ଯ୍ୟନ୍ତ ରହିପାରେ | ଅନେକ କମ୍ପାନୀ ଏହି ସମୟ ମଧ୍ୟରେ ଶୀଘ୍ର ସେମାନଙ୍କର ମଡେଲ୍ ଆକାରକୁ ମାପଚୁପ କରନ୍ତି, ଏବଂ ବ growing ୁଥିବା ମଡେଲ ଏବଂ ଡାଟାସେଟଗୁଡିକୁ ସ୍ଥାନିତ କରିବା ପାଇଁ ଭିତ୍ତିଭୂମି ବିସ୍ତାର ହେବା ଆବଶ୍ୟକ |
ଲକ୍ଷ ଲକ୍ଷ ML ତାଲିମ କାର୍ଯ୍ୟ ଭାର ଉପରେ ଗୁଗୁଲରୁ ହୋଇଥିବା ଅନୁସନ୍ଧାନରୁ ଜଣାପଡିଛି ଯେ ହାରାହାରି 30% ତାଲିମ ସମୟ ଇନପୁଟ୍ ଡାଟା ପାଇପଲାଇନରେ ଖର୍ଚ୍ଚ ହୋଇଥାଏ | ଅତୀତର ଅନୁସନ୍ଧାନ ତାଲିମକୁ ତ୍ୱରାନ୍ୱିତ କରିବା ପାଇଁ ଜିପିୟୁଗୁଡ଼ିକୁ ଅପ୍ଟିମାଇଜ୍ କରିବା ଉପରେ ଧ୍ୟାନ ଦେଇଥିବାବେଳେ ଡାଟା ପାଇପଲାଇନର ବିଭିନ୍ନ ଅଂଶକୁ ଅପ୍ଟିମାଇଜ୍ କରିବାରେ ଅନେକ ଚ୍ୟାଲେଞ୍ଜ ରହିଆସିଛି | ଯେତେବେଳେ ତୁମର ମହତ୍ comp ପୂର୍ଣ୍ଣ ଗଣନା ଶକ୍ତି ଅଛି, ପ୍ରକୃତ ବଟଲିନ୍କ୍ ଫଳାଫଳ ପାଇବା ପାଇଁ ତୁମେ କେତେ ଶୀଘ୍ର ଗଣନାରେ ତଥ୍ୟ ଫିଡ୍ କରିପାରିବ |
ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବରେ, ଡାଟା ଷ୍ଟୋରେଜ୍ ଏବଂ ମ୍ୟାନେଜମେଣ୍ଟରେ ଆହ୍ .ାନଗୁଡିକ ଡାଟା ଅଭିବୃଦ୍ଧି ପାଇଁ ଯୋଜନା ଆବଶ୍ୟକ କରେ, ତୁମେ ଅଗ୍ରଗତି କଲାବେଳେ ତଥ୍ୟର ମୂଲ୍ୟକୁ କ୍ରମାଗତ ଭାବରେ ବାହାର କରିବାକୁ ଅନୁମତି ଦିଏ, ବିଶେଷତ when ଯେତେବେଳେ ତୁମେ ଅଧିକ ଉନ୍ନତ ବ୍ୟବହାର ମାମଲା ଯେପରିକି ଗଭୀର ଶିକ୍ଷା ଏବଂ ସ୍ନାୟୁ ନେଟୱାର୍କରେ ପ୍ରବେଶ କର, ଯାହା ଉପରେ ଅଧିକ ଚାହିଦା ଥାଏ | କ୍ଷମତା, କାର୍ଯ୍ୟଦକ୍ଷତା, ଏବଂ ମାପନୀୟତା ଦୃଷ୍ଟିରୁ ସଂରକ୍ଷଣ |
ବିଶେଷ ଭାବରେ:
ମାପନୀୟତା
ମେସିନ୍ ଲର୍ନିଂ ବିପୁଳ ପରିମାଣର ଡାଟା ପରିଚାଳନା କରିବା ଆବଶ୍ୟକ କରେ ଏବଂ ତଥ୍ୟର ପରିମାଣ ବ increases ଼ିବା ସହିତ ମଡେଲଗୁଡିକର ସଠିକତା ମଧ୍ୟ ଉନ୍ନତ ହୁଏ | ଏହାର ଅର୍ଥ ହେଉଛି ବ୍ୟବସାୟୀମାନେ ପ୍ରତିଦିନ ଅଧିକ ତଥ୍ୟ ସଂଗ୍ରହ ଏବଂ ସଂରକ୍ଷଣ କରିବା ଆବଶ୍ୟକ | ଯେତେବେଳେ ଷ୍ଟୋରେଜ୍ ସ୍କେଲ କରିପାରିବ ନାହିଁ, ଡାଟା-ଇଣ୍ଟେନ୍ସିଭ୍ ୱାର୍କ ଲୋଡ୍ ବୋତଲ ସୃଷ୍ଟି କରେ, କାର୍ଯ୍ୟଦକ୍ଷତାକୁ ସୀମିତ କରେ ଏବଂ ଫଳସ୍ୱରୂପ ବ୍ୟୟବହୁଳ GPU ନିଷ୍କ୍ରିୟ ସମୟ |
ନମନୀୟତା |
ଏକାଧିକ ପ୍ରୋଟୋକଲ ପାଇଁ ନମନୀୟ ସମର୍ଥନ (NFS, SMB, HTTP, FTP, HDFS, ଏବଂ S3 ଅନ୍ତର୍ଭୂକ୍ତ କରି) ଏକ ପ୍ରକାରର ପରିବେଶରେ ସୀମିତ ରହିବା ପରିବର୍ତ୍ତେ ବିଭିନ୍ନ ସିଷ୍ଟମର ଆବଶ୍ୟକତା ପୂରଣ କରିବା ଆବଶ୍ୟକ |
ବିଳମ୍ବ
ଏକାଧିକ ଥର ଡାଟା ପ read ଼ାଯିବା ଏବଂ ପୁନ ere ପ ad ଼ିବା ହେତୁ ମଡେଲ ଗଠନ ଏବଂ ବ୍ୟବହାର ପାଇଁ I / O ବିଳମ୍ବ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ | I / O ବିଳମ୍ବତା ହ୍ରାସ କରିବା ମଡେଲଗୁଡିକର ତାଲିମ ସମୟକୁ ଦିନ କିମ୍ବା ମାସକୁ ଛୋଟ କରିପାରେ | ଦ୍ରୁତ ମଡେଲ ବିକାଶ ସିଧାସଳଖ ଅଧିକ ବ୍ୟବସାୟିକ ସୁବିଧାକୁ ଅନୁବାଦ କରେ |
ଥ୍ରୋପପୁଟ୍
ଦକ୍ଷ ମଡେଲ ତାଲିମ ପାଇଁ ଷ୍ଟୋରେଜ୍ ସିଷ୍ଟମର ଥ୍ରୋପପୁଟ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ | ପ୍ରଶିକ୍ଷଣ ପ୍ରକ୍ରିୟାରେ ବହୁ ପରିମାଣର ତଥ୍ୟ ଅନ୍ତର୍ଭୁକ୍ତ, ସାଧାରଣତ per ଘଣ୍ଟା ପ୍ରତି ଟେରାବାଇଟରେ |
ସମାନ୍ତରାଳ ପ୍ରବେଶ
ଉଚ୍ଚ ଥ୍ରୋପପୁଟ ହାସଲ କରିବାକୁ, ଟ୍ରେନିଂ ମଡେଲଗୁଡିକ କାର୍ଯ୍ୟକଳାପକୁ ଏକାଧିକ ସମାନ୍ତରାଳ କାର୍ଯ୍ୟରେ ବିଭକ୍ତ କରେ | ଏହାର ପ୍ରାୟତ means ଅର୍ଥ ହେଉଛି ଯେ ମେସିନ୍ ଲର୍ନିଂ ଆଲଗୋରିଦମଗୁଡ଼ିକ ଏକାଧିକ ଫାଇଲରୁ (ସମ୍ଭବତ multiple ଏକାଧିକ ଭ physical ତିକ ସର୍ଭରରେ) ସମାନ ଫାଇଲଗୁଡ଼ିକୁ ପ୍ରବେଶ କରନ୍ତି | କାର୍ଯ୍ୟଦକ୍ଷତାକୁ ସାମ୍ନା ନକରି ଷ୍ଟୋରେଜ୍ ସିଷ୍ଟମ୍ ଏକକାଳୀନ ଦାବିଗୁଡିକ ପରିଚାଳନା କରିବା ଜରୁରୀ |
ନିମ୍ନ ବିଳମ୍ବତା, ଉଚ୍ଚ ଥ୍ରୋପପୁଟ ଏବଂ ବୃହତ-ସମାନ୍ତରାଳ I / O ରେ ଏହାର ଉଲ୍ଲେଖନୀୟ ସାମର୍ଥ୍ୟ ସହିତ, ଡେଲ ପାୱାରସ୍କେଲ୍ GPU- ତ୍ୱରିତ ଗଣନା ପାଇଁ ଏକ ଆଦର୍ଶ ସଂରକ୍ଷଣ ଉପାଦାନ | ପାୱାରସ୍କେଲ୍ ବିଶ୍ଳେଷଣ ମଡେଲଗୁଡିକ ପାଇଁ ଆବଶ୍ୟକ ସମୟକୁ ଫଳପ୍ରଦ ଭାବରେ ହ୍ରାସ କରେ ଯାହା ମଲ୍ଟି-ଟେରାବାଇଟ୍ ଡାଟାସେଟ୍ଗୁଡ଼ିକୁ ପ୍ରଶିକ୍ଷଣ ଦେଇଥାଏ | ପାୱାରସ୍କେଲ୍ ଅଲ-ଫ୍ଲାସ୍ ଷ୍ଟୋରେଜ୍ ରେ, ବ୍ୟାଣ୍ଡୱିଡଥ୍ 18 ଗୁଣ ବ increases ିଥାଏ, I / O ବୋତଲଗୁଡ଼ିକୁ ଦୂର କରି, ଏବଂ ବହୁ ପରିମାଣର ଅଣସଂଗଠିତ ତଥ୍ୟର ମୂଲ୍ୟକୁ ତ୍ୱରାନ୍ୱିତ ଏବଂ ଅନଲକ୍ କରିବାକୁ ବିଦ୍ୟମାନ ଇସିଲନ୍ କ୍ଲଷ୍ଟରରେ ଯୋଗ କରାଯାଇପାରିବ |
ଅଧିକନ୍ତୁ, ପାୱାରସ୍କେଲର ମଲ୍ଟି-ପ୍ରୋଟୋକଲ୍ ଆକସେସ୍ କ୍ଷମତା କାର୍ଯ୍ୟଭାର ଚଲାଇବା ପାଇଁ ଅସୀମିତ ନମନୀୟତା ପ୍ରଦାନ କରିଥାଏ, ଯାହାକି ଗୋଟିଏ ପ୍ରୋଟୋକଲ୍ ବ୍ୟବହାର କରି ତଥ୍ୟ ସଂରକ୍ଷଣ କରିବାକୁ ଏବଂ ଅନ୍ୟଟି ବ୍ୟବହାର କରି ଆକ୍ସେସ୍ କରିବାକୁ ଅନୁମତି ଦେଇଥାଏ | ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବରେ, ପାୱାର୍ ସ୍କେଲ୍ ପ୍ଲାଟଫର୍ମର ଶକ୍ତିଶାଳୀ ବ features ଶିଷ୍ଟ୍ୟ, ନମନୀୟତା, ମାପନୀୟତା, ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ୍-ଗ୍ରେଡ୍ କାର୍ଯ୍ୟକାରିତା ନିମ୍ନଲିଖିତ ଆହ୍ address ାନଗୁଡିକୁ ସମାଧାନ କରିବାରେ ସାହାଯ୍ୟ କରେ:
- ମଡେଲ୍ ଟ୍ରେନିଂ ଚକ୍ରକୁ ହ୍ରାସ କରି 2.7 ଗୁଣ ପର୍ଯ୍ୟନ୍ତ ନବସୃଜନକୁ ତ୍ୱରାନ୍ୱିତ କରନ୍ତୁ |
- I / O ବୋତଲଗୁଡିକୁ ଦୂର କରନ୍ତୁ ଏବଂ ଦ୍ରୁତ ମଡେଲ ତାଲିମ ଏବଂ ବ valid ଧତା, ଉନ୍ନତ ମଡେଲ ସଠିକତା, ଉନ୍ନତ ଡାଟା ବିଜ୍ science ାନ ଉତ୍ପାଦନକ୍ଷମତା, ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ-ଗ୍ରେଡ୍ ବ features ଶିଷ୍ଟ୍ୟ, ଉଚ୍ଚ କାର୍ଯ୍ୟଦକ୍ଷତା, ସମନ୍ୱୟ ଏବଂ ମାପକାଠି ବ୍ୟବହାର କରି କମ୍ପ୍ୟୁଟିଂ ନିବେଶ ଉପରେ ସର୍ବାଧିକ ଫେରସ୍ତ ଫେରସ୍ତ | ଗୋଟିଏ କ୍ଲଷ୍ଟରରେ 119 PB ପର୍ଯ୍ୟନ୍ତ ପ୍ରଭାବଶାଳୀ ଷ୍ଟୋରେଜ୍ କ୍ଷମତା ବ୍ୟବହାର କରି ଗଭୀର, ଉଚ୍ଚ-ବିଭେଦନ ଡାଟାବେସ ସହିତ ମଡେଲ ସଠିକତା ବୃଦ୍ଧି କର |
- ଛୋଟ ଏବଂ ସ୍ ently ାଧୀନ ଭାବରେ ଗଣନା ଏବଂ ଷ୍ଟୋରେଜ୍ ମାପିବା, ଦୃ ust ଡାଟା ସୁରକ୍ଷା ଏବଂ ସୁରକ୍ଷା ବିକଳ୍ପ ପ୍ରଦାନ କରି ସ୍କେଲରେ ନିୟୋଜନ ହାସଲ କରନ୍ତୁ |
- ଦ୍ରୁତ, କମ୍ ବିପଦପୂର୍ଣ୍ଣ ନିୟୋଜନ ପାଇଁ ସ୍ଥାନ-ଆନାଲିଟିକ୍ସ ଏବଂ ପୂର୍ବ-ବ ated ଧ ସମାଧାନ ସହିତ ତଥ୍ୟ ବିଜ୍ଞାନ ଉତ୍ପାଦନରେ ଉନ୍ନତି କର |
- NVIDIA GPU ତ୍ୱରଣ ଏବଂ NVIDIA DGX ସିଷ୍ଟମ୍ ସହିତ ରେଫରେନ୍ସ ସ୍ଥାପତ୍ୟକୁ ଅନ୍ତର୍ଭୁକ୍ତ କରି ସର୍ବୋତ୍ତମ-ପ୍ରଜାତିର ପ୍ରଯୁକ୍ତିବିଦ୍ୟା ଉପରେ ଆଧାରିତ ପ୍ରମାଣିତ ଡିଜାଇନ୍ଗୁଡ଼ିକୁ ପରିଚାଳନା କରିବା | ପାୱାରସ୍କେଲର ଉଚ୍ଚ କାର୍ଯ୍ୟଦକ୍ଷତା ଏବଂ ସମାନତା ମେସିନ୍ ଶିଖିବାର ପ୍ରତ୍ୟେକ ପର୍ଯ୍ୟାୟରେ ଷ୍ଟୋରେଜ୍ କାର୍ଯ୍ୟଦକ୍ଷତା ଆବଶ୍ୟକତା ପୂରଣ କରେ, ତଥ୍ୟ ହାସଲ ଏବଂ ପ୍ରସ୍ତୁତି ଠାରୁ ଆରମ୍ଭ କରି ମଡେଲ୍ ଟ୍ରେନିଂ ଏବଂ ଇନ୍ଫେରେନ୍ସ ପର୍ଯ୍ୟନ୍ତ | OneFS ଅପରେଟିଂ ସିଷ୍ଟମ୍ ସହିତ, ସମସ୍ତ ନୋଡ୍ ସମାନ OneFS- ଚାଳିତ କ୍ଲଷ୍ଟର ମଧ୍ୟରେ ନିରବଚ୍ଛିନ୍ନ ଭାବରେ କାର୍ଯ୍ୟ କରିପାରିବ, ଏଣ୍ଟରପ୍ରାଇଜ୍ ସ୍ତରୀୟ ବ features ଶିଷ୍ଟ୍ୟ ଯେପରିକି କାର୍ଯ୍ୟଦକ୍ଷତା ପରିଚାଳନା, ଡାଟା ପରିଚାଳନା, ସୁରକ୍ଷା ଏବଂ ତଥ୍ୟ ସୁରକ୍ଷା, ମଡେଲ ତାଲିମ ଏବଂ ବ୍ୟବସାୟ ପାଇଁ ବ valid ଧତାକୁ ଶୀଘ୍ର ସମାପ୍ତ କରିବାକୁ ସକ୍ଷମ କରିଥାଏ |
ପୋଷ୍ଟ ସମୟ: ଜୁଲାଇ -03-2023 |